Введение - Avala Documentation

Avala — это платформа, на которой команды, занимающиеся робототехникой, автономными транспортными средствами и Physical AI, визуализируют, исследуют и аннотируют свои сенсорные данные — всё в одном месте. Загружайте записи MCAP, сканы LiDAR, видеопотоки с камер или сцены Gaussian Splat. Воспроизводите их в мультисенсорном просмотрщике с GPU-ускорением, синхронизированными таймлайнами и настраиваемыми макетами панелей. Когда будете готовы к разметке, переключитесь в режим аннотации на тех же данных — без экспорта, без смены инструментов, без повторной загрузки. Платформа обеспечивает полный жизненный цикл от необработанных сенсорных данных до размеченных обучающих наборов.

Кто использует Avala

Команды автономных транспортных средств — Размечают изображения с камер, облака точек LiDAR и синхронизированные мультисенсорные записи для обучения моделей восприятия. Визуализация и отладка данных MCAP/ROS с мультикамерной проекцией.
Компании в сфере робототехники — Аннотируют данные восприятия для навигации, манипуляции и понимания сцены. Исследуют 3D-облака точек с GPU-ускоренным рендерингом.
Команды Physical AI / пространственных вычислений — Работают со сценами Gaussian Splat, плотными облаками точек и мультимодальными сенсорными данными для 3D-понимания мира и переноса из симуляции в реальность.
Команды AI/ML — Создают обучающие наборы данных для обнаружения объектов, сегментации, классификации и трекинга по изображениям, видео и 3D-данным.
Исследовательские лаборатории — Формируют размеченные наборы данных для исследований в области компьютерного зрения и 3D-восприятия с профессиональными инструментами аннотации и контроля качества.

Возможности платформы

Визуализация

Движок визуализации Avala полностью работает в браузере на основе WebGPU и WebGL.

Мультисенсорное воспроизведение MCAP/ROS — Открывайте файлы MCAP, содержащие данные камер, LiDAR, радара и IMU. Просмотрщик автоматически определяет топики и назначает типы панелей из 8 доступных: Изображение, 3D / Облако точек, График, Сырые сообщения, Лог, Карта, Датчик и Переходы состояний.
GPU-ускоренный рендеринг 3D-облаков точек — Рендеринг облаков точек с 6 режимами визуализации: Нейтральный, Интенсивность, Радуга, Метка, Паноптический и Проекция изображения. Вычислительные шейдеры WebGPU выполняют отсечение по пирамиде видимости и выбор уровня детализации на GPU.
Просмотрщик Gaussian Splat — Исследуйте 3D-реконструкции сцен в WebGPU-ускоренном просмотрщике Gaussian Splat с иерархией сцены, панелью свойств и статистикой.
Синхронное воспроизведение нескольких камер — Просматривайте несколько видеопотоков синхронно с наложениями проекции LiDAR на камеру. Поддерживаются модели камер pinhole и double-sphere (рыбий глаз).
Настраиваемые многооконные макеты — Перетаскивание панелей с изменяемыми размерами. Макет по умолчанию размещает боковую панель топиков, контентные панели и информационную панель файла в горизонтальной конфигурации.
Навигация по таймлайну — Покадровая навигация, переход по временным меткам и управление скоростью воспроизведения по всем синхронизированным сенсорным потокам.

Аннотация

Профессиональные инструменты аннотации для каждого типа данных, подкреплённые контролем качества и командными рабочими процессами.

Ограничивающие рамки — 2D-прямоугольные области для обнаружения объектов
Полигоны — Произвольные формы для точных границ объектов
3D-кубоиды — 3D-ограничивающие параллелепипеды в данных облаков точек и мультисенсорных данных с видами сверху, в перспективе и сбоку
Сегментация — Попиксельные маски классификации
Полилинии — Аннотации путей, полос и границ
Ключевые точки — Аннотации ориентиров и поз
Классификация — Метки атрибутов на уровне сцены и объекта

Контроль качества включает многоэтапные рабочие процессы рецензирования, отслеживание проблем аннотации, метрики согласия между аннотаторами и рабочие процессы консенсуса. Трекинг объектов обеспечивает постоянные идентификаторы в кадрах видео и последовательностях. Управляемые услуги разметки доступны для команд, которым нужны профессиональные аннотаторы, обученные в их предметной области.

Поддерживаемые типы данных

Avala работает с пятью модальностями данных, каждая из которых имеет специализированные рабочие процессы визуализации и аннотации:

Тип данных	Форматы	Описание
Изображения	JPEG, PNG, WebP	Визуализация и аннотация одиночных кадров со всеми 2D-инструментами
Видео	MP4, MOV	Конвертируются в последовательности кадров для воспроизведения, покадровой аннотации и трекинга объектов
Облака точек	PCD, PLY	3D-сканы LiDAR с GPU-ускоренным рендерингом и аннотацией кубоидами
MCAP / ROS	MCAP	Мультисенсорный контейнер с данными камер, LiDAR, радара и IMU; многопанельное воспроизведение и мультикамерная проекция
Splat	Gaussian Splat	3D-визуализация и аннотация сцен в WebGPU-среде Gaussian Splat

SDK

Python SDK

Установка: pip install avala — полные аннотации типов и поддержка async.

TypeScript SDK

Установка: npm install @avala-ai/sdk — работает в Node.js и браузерах.

Изучите платформу

Визуализация

Мультисенсорный просмотрщик с GPU-ускорением: 8 типов панелей, 6 режимов рендеринга облаков точек и поддержка Gaussian Splat.

Аннотация

Профессиональные инструменты аннотации для 2D, 3D, видео и мультисенсорных данных с контролем качества.

Интеграции

Подключение к S3, MCP, MCAP/ROS, вебхукам и пайплайнам инференса.

Следующие шаги

Быстрый старт

Создайте свой первый проект аннотации менее чем за 60 секунд.

Основные концепции

Разберитесь в наборах данных, проектах, задачах и жизненном цикле аннотации.

Визуализация

Изучите мультисенсорный просмотрщик, рендерер 3D-облаков точек и просмотрщик Gaussian Splat.

SDK

Установите Python SDK или TypeScript SDK и начните разработку.

​Кто использует Avala

​Возможности платформы

​Визуализация

​Аннотация

​Поддерживаемые типы данных

​SDK

Python SDK

TypeScript SDK

​Изучите платформу

​Следующие шаги

Быстрый старт

Основные концепции

Визуализация

SDK

Кто использует Avala

Возможности платформы

Визуализация

Аннотация

Поддерживаемые типы данных

SDK

Изучите платформу

Следующие шаги