Saltar al contenido principal
Avala soporta cinco modalidades de datos, cada una con visualización acelerada por GPU y flujos de anotación diseñados específicamente. Esta página cubre lo que puede ver, lo que puede etiquetar y los formatos soportados para cada tipo.

Imagen

Visualización: Las imágenes se muestran en el visor de imágenes con desplazamiento, zoom e inspección a nivel de píxel. Cuando forman parte de una grabación MCAP, las imágenes aparecen en paneles Image dedicados sincronizados con otros flujos de sensores. Anotación: Cada imagen se anota de forma independiente como un fotograma individual. Las siete herramientas de anotación 2D están disponibles: bounding boxes, polígonos, máscaras de segmentación, polilíneas, keypoints, clasificación y seguimiento de objetos (en secuencias de video). Formatos soportados: JPEG, PNG, WebP, BMP Casos de uso: Detección de objetos, segmentación de instancias, segmentación semántica, clasificación de imágenes, detección de keypoints, estimación de pose.

Video

Visualización: Los videos se convierten automáticamente a secuencias de fotogramas al subirlos, permitiendo la reproducción fotograma a fotograma con desplazamiento en la línea de tiempo. Navegue hacia adelante y atrás entre fotogramas, salte a marcas de tiempo específicas o reproduzca a velocidades configurables. Anotación: Los anotadores trabajan fotograma a fotograma con seguimiento de objetos a lo largo de la línea de tiempo. Los IDs de objetos persisten entre fotogramas para una asignación de identidad consistente. Todas las herramientas de anotación 2D están disponibles en cada fotograma. Formatos soportados: MP4, MOV Casos de uso: Seguimiento de objetos, reconocimiento de acciones, detección de eventos temporales, etiquetado de escenas de conducción, análisis de comportamiento.
El procesamiento de video ocurre en segundo plano después de la subida. Los videos grandes pueden tardar varios minutos en convertirse. Puede monitorear el estado de la secuencia en Mission Control o a través de la API.

LiDAR / Nube de puntos

Visualización: Las nubes de puntos se renderizan en un visor 3D con vista cenital, vista en perspectiva y vistas laterales. Seis modos de visualización permiten colorear los puntos por diferentes propiedades:
ModoDescripción
NeutralColor uniforme único para visión general estructural
IntensityIntensidad de retorno — resalta superficies reflectivas
RainbowColoreado temporal o secuencial
LabelColoreado por clase semántica de las anotaciones
PanopticColoreado a nivel de instancia para objetos individuales
Image ProjectionImágenes de cámara proyectadas sobre la nube de puntos
El visor usa compute shaders de WebGPU para frustum culling y renderizado de nivel de detalle, manteniendo altas tasas de fotogramas incluso en escaneos densos. Anotación: Los anotadores colocan cuboides 3D con control completo de posición, dimensión y rotación. Las proyecciones de cuboides se muestran en vistas de cámara sincronizadas cuando hay datos de calibración de cámara disponibles. Formatos soportados: PCD, PLY Casos de uso: Detección de objetos 3D, percepción para conducción autónoma, navegación robótica, reconstrucción de escenas, creación de mapas HD.

MCAP

Visualización: Las grabaciones MCAP se muestran en el visor multi-sensor con hasta ocho tipos de paneles: Image, 3D / Point Cloud, Plot, Raw Messages, Log, Map, Gauge y State Transitions. Avala detecta automáticamente los tipos de mensajes en la grabación y asigna los topics al tipo de panel apropiado. Todos los paneles comparten una línea de tiempo sincronizada para la reproducción coordinada de flujos de cámara, LiDAR, radar, IMU y otros sensores. El compositor de diseño construye automáticamente una disposición de paneles optimizada basada en los topics de su grabación, o puede personalizar el diseño manualmente. Navegue fotograma a fotograma, desplácese a cualquier marca de tiempo o reproduzca la grabación completa con velocidad configurable. Anotación: Avala analiza archivos MCAP para extraer y sincronizar flujos de sensores. Las imágenes de cámara se muestran junto con datos LiDAR proyectados, permitiendo anotación multi-cámara con contexto 3D. Los anotadores colocan cuboides 3D que se proyectan consistentemente en todas las vistas de cámara. Formatos soportados: MCAP (con soporte de mensajes ROS) Casos de uso: Fusión multi-sensor, percepción de vista envolvente, etiquetado de datos de vehículos autónomos, calibración de sensores robóticos, revisión de datos de flota.
El soporte MCAP incluye extracción automática de intrínsecos y extrínsecos de cámara para proyección precisa de LiDAR-a-cámara. Se soportan modelos de cámara pinhole y double-sphere (ojo de pez). Consulte la guía de integración MCAP / ROS para detalles de configuración.

Splat

Visualización: Las escenas Gaussian Splat se renderizan en un visor 3D acelerado por WebGPU. Navegue libremente por reconstrucciones de escenas 3D fotorrealistas con controles de cámara suaves. El renderizador usa GPU radix sorting, buffer pooling y precompilación de pipelines para rendimiento en tiempo real. Anotación: Los anotadores navegan por el entorno reconstruido y colocan anotaciones 3D directamente en la escena. Las etiquetas de clasificación pueden aplicarse a la escena completa o a regiones individuales. Formatos soportados: Gaussian Splat Casos de uso: Comprensión de escenas 3D, anotación para síntesis de vistas novedosas, datos de entrenamiento para IA espacial, mapeo de entornos.

Comparación de capacidades

La siguiente tabla muestra las capacidades de visualización y anotación para cada tipo de dato:
CapacidadImagenVideoNube de puntosMCAPSplat
Visualización
Visor de imagen 2D
Visor de nube de puntos 3D
Visor 3D Splat
Diseño multi-panel
Reproducción con línea de tiempo
Modos de visualización (6)
Anotación
Bounding Box
Polígono
Cuboide 3D
Segmentación
Polilínea
Keypoints
Clasificación
Seguimiento de objetos

Requisitos de subida

PropiedadLímite
Tamaño máximo de archivo (imágenes)20 MB por archivo
Tamaño máximo de archivo (video)2 GB por archivo
Tamaño máximo de archivo (nube de puntos)500 MB por archivo
Tamaño máximo de archivo (MCAP)5 GB por archivo
Formatos de imagen soportadosJPEG, PNG, WebP, BMP
Formatos de video soportadosMP4, MOV
Formatos de nube de puntos soportadosPCD, PLY
Formatos multi-sensor soportadosMCAP
Los límites de subida pueden variar según su plan. Contacte a support@avala.ai si necesita subir archivos que excedan estos límites.

Próximos pasos

Gestión de datasets

Suba, organice y gestione sus datos en Mission Control.

Integración MCAP / ROS

Configure pipelines de datos multi-sensor con MCAP y ROS.

Conceptos fundamentales

Comprenda visores, paneles, diseños y otros conceptos de la plataforma.

Arquitectura

Conozca cómo funcionan juntos el motor de visualización y los servicios backend.