Перейти к основному содержанию
Avala — это платформа, на которой команды, занимающиеся робототехникой, автономными транспортными средствами и Physical AI, визуализируют, исследуют и аннотируют свои сенсорные данные — всё в одном месте. Загружайте записи MCAP, сканы LiDAR, видеопотоки с камер или сцены Gaussian Splat. Воспроизводите их в мультисенсорном просмотрщике с GPU-ускорением, синхронизированными таймлайнами и настраиваемыми макетами панелей. Когда будете готовы к разметке, переключитесь в режим аннотации на тех же данных — без экспорта, без смены инструментов, без повторной загрузки. Платформа обеспечивает полный жизненный цикл от необработанных сенсорных данных до размеченных обучающих наборов.

Кто использует Avala

  • Команды автономных транспортных средств — Размечают изображения с камер, облака точек LiDAR и синхронизированные мультисенсорные записи для обучения моделей восприятия. Визуализация и отладка данных MCAP/ROS с мультикамерной проекцией.
  • Компании в сфере робототехники — Аннотируют данные восприятия для навигации, манипуляции и понимания сцены. Исследуют 3D-облака точек с GPU-ускоренным рендерингом.
  • Команды Physical AI / пространственных вычислений — Работают со сценами Gaussian Splat, плотными облаками точек и мультимодальными сенсорными данными для 3D-понимания мира и переноса из симуляции в реальность.
  • Команды AI/ML — Создают обучающие наборы данных для обнаружения объектов, сегментации, классификации и трекинга по изображениям, видео и 3D-данным.
  • Исследовательские лаборатории — Формируют размеченные наборы данных для исследований в области компьютерного зрения и 3D-восприятия с профессиональными инструментами аннотации и контроля качества.

Возможности платформы

Визуализация

Движок визуализации Avala полностью работает в браузере на основе WebGPU и WebGL.
  • Мультисенсорное воспроизведение MCAP/ROS — Открывайте файлы MCAP, содержащие данные камер, LiDAR, радара и IMU. Просмотрщик автоматически определяет топики и назначает типы панелей из 8 доступных: Изображение, 3D / Облако точек, График, Сырые сообщения, Лог, Карта, Датчик и Переходы состояний.
  • GPU-ускоренный рендеринг 3D-облаков точек — Рендеринг облаков точек с 6 режимами визуализации: Нейтральный, Интенсивность, Радуга, Метка, Паноптический и Проекция изображения. Вычислительные шейдеры WebGPU выполняют отсечение по пирамиде видимости и выбор уровня детализации на GPU.
  • Просмотрщик Gaussian Splat — Исследуйте 3D-реконструкции сцен в WebGPU-ускоренном просмотрщике Gaussian Splat с иерархией сцены, панелью свойств и статистикой.
  • Синхронное воспроизведение нескольких камер — Просматривайте несколько видеопотоков синхронно с наложениями проекции LiDAR на камеру. Поддерживаются модели камер pinhole и double-sphere (рыбий глаз).
  • Настраиваемые многооконные макеты — Перетаскивание панелей с изменяемыми размерами. Макет по умолчанию размещает боковую панель топиков, контентные панели и информационную панель файла в горизонтальной конфигурации.
  • Навигация по таймлайну — Покадровая навигация, переход по временным меткам и управление скоростью воспроизведения по всем синхронизированным сенсорным потокам.

Аннотация

Профессиональные инструменты аннотации для каждого типа данных, подкреплённые контролем качества и командными рабочими процессами.
  • Ограничивающие рамки — 2D-прямоугольные области для обнаружения объектов
  • Полигоны — Произвольные формы для точных границ объектов
  • 3D-кубоиды — 3D-ограничивающие параллелепипеды в данных облаков точек и мультисенсорных данных с видами сверху, в перспективе и сбоку
  • Сегментация — Попиксельные маски классификации
  • Полилинии — Аннотации путей, полос и границ
  • Ключевые точки — Аннотации ориентиров и поз
  • Классификация — Метки атрибутов на уровне сцены и объекта
Контроль качества включает многоэтапные рабочие процессы рецензирования, отслеживание проблем аннотации, метрики согласия между аннотаторами и рабочие процессы консенсуса. Трекинг объектов обеспечивает постоянные идентификаторы в кадрах видео и последовательностях. Управляемые услуги разметки доступны для команд, которым нужны профессиональные аннотаторы, обученные в их предметной области.

Поддерживаемые типы данных

Avala работает с пятью модальностями данных, каждая из которых имеет специализированные рабочие процессы визуализации и аннотации:
Тип данныхФорматыОписание
ИзображенияJPEG, PNG, WebPВизуализация и аннотация одиночных кадров со всеми 2D-инструментами
ВидеоMP4, MOVКонвертируются в последовательности кадров для воспроизведения, покадровой аннотации и трекинга объектов
Облака точекPCD, PLY3D-сканы LiDAR с GPU-ускоренным рендерингом и аннотацией кубоидами
MCAP / ROSMCAPМультисенсорный контейнер с данными камер, LiDAR, радара и IMU; многопанельное воспроизведение и мультикамерная проекция
SplatGaussian Splat3D-визуализация и аннотация сцен в WebGPU-среде Gaussian Splat

SDK

Python SDK

Установка: pip install avala — полные аннотации типов и поддержка async.

TypeScript SDK

Установка: npm install @avala-ai/sdk — работает в Node.js и браузерах.

Изучите платформу

Визуализация

Визуализация

Мультисенсорный просмотрщик с GPU-ускорением: 8 типов панелей, 6 режимов рендеринга облаков точек и поддержка Gaussian Splat.

Аннотация

Аннотация

Профессиональные инструменты аннотации для 2D, 3D, видео и мультисенсорных данных с контролем качества.

Интеграции

Интеграции

Подключение к S3, MCP, MCAP/ROS, вебхукам и пайплайнам инференса.

Следующие шаги

Быстрый старт

Создайте свой первый проект аннотации менее чем за 60 секунд.

Основные концепции

Разберитесь в наборах данных, проектах, задачах и жизненном цикле аннотации.

Визуализация

Изучите мультисенсорный просмотрщик, рендерер 3D-облаков точек и просмотрщик Gaussian Splat.

SDK

Установите Python SDK или TypeScript SDK и начните разработку.