Passer au contenu principal
Avala supporte cinq modalités de données, chacune avec une visualisation accélérée par GPU et des flux d’annotation dédiés. Cette page couvre ce que vous pouvez voir, ce que vous pouvez étiqueter et les formats supportés pour chaque type.

Image

Visualisation : Les images sont affichées dans le visualiseur d’images avec panoramique, zoom et inspection au niveau du pixel. Lorsqu’elles font partie d’un enregistrement MCAP, les images apparaissent dans des panneaux Image dédiés synchronisés avec les autres flux de capteurs. Annotation : Chaque image est annotée indépendamment comme une image unique. Les sept outils d’annotation 2D sont disponibles : boîtes englobantes, polygones, masques de segmentation, polylignes, points clés, classification et suivi d’objets (dans les séquences vidéo). Formats supportés : JPEG, PNG, WebP, BMP Cas d’usage : Détection d’objets, segmentation d’instances, segmentation sémantique, classification d’images, détection de points clés, estimation de pose.

Vidéo

Visualisation : Les vidéos sont automatiquement converties en séquences d’images lors du téléchargement, permettant une lecture image par image avec navigation par la chronologie. Naviguez en avant et en arrière à travers les images, sautez à des horodatages spécifiques, ou rejouez à des vitesses configurables. Annotation : Les annotateurs travaillent image par image avec un suivi d’objets sur la chronologie. Les identifiants d’objets persistent entre les images pour une attribution d’identité cohérente. Tous les outils d’annotation 2D sont disponibles sur chaque image. Formats supportés : MP4, MOV Cas d’usage : Suivi d’objets, reconnaissance d’actions, détection d’événements temporels, étiquetage de scènes de conduite, analyse comportementale.
Le traitement vidéo s’effectue en arrière-plan après le téléchargement. Les vidéos volumineuses peuvent prendre plusieurs minutes à convertir. Vous pouvez surveiller le statut de la séquence dans Mission Control ou via l’API.

LiDAR / Nuage de points

Visualisation : Les nuages de points sont rendus dans un visualiseur 3D avec vue de dessus, vue en perspective et vues latérales. Six modes de visualisation vous permettent de colorer les points selon différentes propriétés :
ModeDescription
NeutreCouleur uniforme unique pour un aperçu structurel
IntensitéForce de retour — met en évidence les surfaces réfléchissantes
Arc-en-cielColoration temporelle ou séquentielle
ÉtiquetteColoration par classe sémantique à partir des annotations
PanoptiqueColoration au niveau de l’instance pour les objets individuels
Projection d’imageImagerie caméra projetée sur le nuage de points
Le visualiseur utilise des shaders de calcul WebGPU pour le frustum culling et le rendu par niveau de détail, maintenant des taux d’images élevés même sur des scans denses. Annotation : Les annotateurs placent des cuboïdes 3D avec un contrôle complet de la position, des dimensions et de la rotation. Les projections de cuboïdes sont affichées dans les vues caméra synchronisées lorsque les données de calibration de caméra sont disponibles. Formats supportés : PCD, PLY Cas d’usage : Détection d’objets 3D, perception pour la conduite autonome, navigation robotique, reconstruction de scène, création de cartes HD.

MCAP

Visualisation : Les enregistrements MCAP sont affichés dans le visualiseur multi-capteurs avec jusqu’à huit types de panneaux : Image, 3D / Nuage de points, Graphique, Messages bruts, Journal, Carte, Jauge et Transitions d’état. Avala détecte automatiquement les types de messages dans l’enregistrement et assigne les topics au type de panneau approprié. Tous les panneaux partagent une chronologie synchronisée pour la lecture coordonnée des flux caméra, LiDAR, radar, IMU et autres capteurs. Le compositeur de disposition construit automatiquement un arrangement de panneaux optimisé basé sur les topics de votre enregistrement, ou vous pouvez personnaliser la disposition manuellement. Naviguez image par image, parcourez n’importe quel horodatage, ou rejouez l’enregistrement complet à vitesse configurable. Annotation : Avala analyse les fichiers MCAP pour extraire et synchroniser les flux de capteurs. Les images caméra sont affichées aux côtés des données LiDAR projetées, permettant une annotation multi-caméras avec un contexte 3D. Les annotateurs placent des cuboïdes 3D qui se projettent de manière cohérente sur toutes les vues caméra. Formats supportés : MCAP (avec support des messages ROS) Cas d’usage : Fusion multi-capteurs, perception surround, étiquetage de données de véhicules autonomes, calibration de capteurs robotiques, révision de données de flotte.
Le support MCAP inclut l’extraction automatique des intrinsèques et extrinsèques des caméras pour une projection précise LiDAR vers caméra. Les modèles de caméra sténopé et double sphère (fisheye) sont supportés. Consultez le guide d’intégration MCAP / ROS pour les détails de configuration.

Splat

Visualisation : Les scènes Gaussian Splat sont rendues dans un visualiseur 3D accéléré par WebGPU. Naviguez librement à travers des reconstructions de scènes 3D photoréalistes avec des contrôles de caméra fluides. Le moteur de rendu utilise le tri radix GPU, le pooling de tampons et la pré-compilation des pipelines pour des performances en temps réel. Annotation : Les annotateurs naviguent dans l’environnement reconstruit et placent des annotations 3D directement dans la scène. Des étiquettes de classification peuvent être appliquées à la scène entière ou à des régions individuelles. Formats supportés : Gaussian Splat Cas d’usage : Compréhension de scènes 3D, annotation de synthèse de nouvelles vues, données d’entraînement pour l’IA spatiale, cartographie d’environnement.

Comparaison des capacités

Le tableau suivant montre les capacités de visualisation et d’annotation pour chaque type de données :
CapacitéImageVidéoNuage de pointsMCAPSplat
Visualisation
Visualiseur d’images 2DOuiOuiOui
Visualiseur de nuages de points 3DOuiOui
Visualiseur 3D SplatOui
Disposition multi-panneauxOui
Lecture chronologiqueOuiOuiOui
Modes de visualisation (6)OuiOui
Annotation
Boîte englobanteOuiOui
PolygoneOuiOui
Cuboïde 3DOuiOuiOui
SegmentationOuiOui
PolyligneOuiOui
Points clésOuiOui
ClassificationOuiOuiOuiOuiOui
Suivi d’objetsOuiOuiOui

Exigences de téléchargement

PropriétéLimite
Taille max. de fichier (images)20 Mo par fichier
Taille max. de fichier (vidéo)2 Go par fichier
Taille max. de fichier (nuage de points)500 Mo par fichier
Taille max. de fichier (MCAP)5 Go par fichier
Formats d’image supportésJPEG, PNG, WebP, BMP
Formats vidéo supportésMP4, MOV
Formats de nuages de points supportésPCD, PLY
Formats multi-capteurs supportésMCAP
Les limites de téléchargement peuvent varier selon votre forfait. Contactez support@avala.ai si vous devez télécharger des fichiers dépassant ces limites.

Prochaines étapes

Gestion des jeux de données

Téléchargez, organisez et gérez vos données dans Mission Control.

Intégration MCAP / ROS

Configurez des pipelines de données multi-capteurs avec MCAP et ROS.

Concepts fondamentaux

Comprenez les visualiseurs, panneaux, dispositions et autres concepts de la plateforme.

Architecture

Découvrez comment le moteur de visualisation et les services backend fonctionnent ensemble.