跳转到主要内容
Avala 支持五种数据模态,每种都配备 GPU 加速可视化和专门构建的标注工作流。本页介绍每种类型可以看到什么、可以标注什么以及支持的格式。

图像

可视化: 图像在图像查看器中显示,支持平移、缩放和像素级检查。作为 MCAP 录制的一部分时,图像出现在与其他传感器流同步的专用图像面板中。 标注: 每张图像作为单帧独立标注。所有七种 2D 标注工具都可用:边界框、多边形、分割蒙版、折线、关键点、分类和目标跟踪(在视频序列中)。 支持格式: JPEG、PNG、WebP、BMP 使用场景: 目标检测、实例分割、语义分割、图像分类、关键点检测、姿态估计。

视频

可视化: 视频在上传时自动转换为帧序列,支持逐帧回放和时间轴滚动。可以前后导航帧、跳转到特定时间戳或以可配置速度回放。 标注: 标注员逐帧工作,支持跨时间轴的目标跟踪。对象 ID 在帧之间保持一致,用于统一的身份分配。每帧都可使用所有 2D 标注工具。 支持格式: MP4、MOV 使用场景: 目标跟踪、动作识别、时间事件检测、驾驶场景标注、行为分析。
视频处理在上传后在后台进行。大视频可能需要几分钟来转换。您可以在 Mission Control 中或通过 API 监控序列状态。

LiDAR / 点云

可视化: 点云在 3D 查看器中渲染,支持鸟瞰视图、透视视图和侧视图。六种可视化模式让您按不同属性着色点:
模式描述
中性用于结构概览的单一均匀颜色
强度返回强度——突出反射表面
彩虹时间或顺序着色
标签来自标注的语义类别着色
全景用于单个对象的实例级着色
图像投影投影到点云上的摄像头图像
查看器使用 WebGPU 计算着色器进行视锥体裁剪和细节层次渲染,即使在密集扫描上也能保持高帧率。 标注: 标注员放置具有完整位置、尺寸和旋转控制的 3D 长方体。当有摄像头标定数据时,长方体投影显示在同步的摄像头视图中。 支持格式: PCD、PLY 使用场景: 3D 目标检测、自动驾驶感知、机器人导航、场景重建、高精地图创建。

MCAP

可视化: MCAP 录制在多传感器查看器中显示,最多支持八种面板类型:图像、3D / 点云、图表、原始消息、日志、地图、仪表盘和状态转换。Avala 自动检测录制中的消息类型并将 topic 分配到适当的面板类型。所有面板共享同步时间轴,用于协调摄像头、LiDAR、雷达、IMU 和其他传感器流的回放。 布局组合器根据录制中的 topic 自动构建优化的面板排列,您也可以手动自定义布局。逐帧导航、滚动到任意时间戳,或以可配置速度回放完整录制。 标注: Avala 解析 MCAP 文件以提取和同步传感器流。摄像头图像与投影的 LiDAR 数据一起显示,支持带有 3D 上下文的多摄像头标注。标注员放置的 3D 长方体在所有摄像头视图中一致投影。 支持格式: MCAP(支持 ROS 消息) 使用场景: 多传感器融合、环视感知、自动驾驶数据标注、机器人传感器标定、车队数据审核。
MCAP 支持包括自动提取摄像头内参和外参,用于精确的 LiDAR 到摄像头投影。支持针孔和双球面(鱼眼)摄像头模型。详情请参阅 MCAP / ROS 集成指南

Splat

可视化: Gaussian Splat 场景在 WebGPU 加速的 3D 查看器中渲染。在逼真的 3D 场景重建中自由导航,支持平滑的摄像头控制。渲染器使用 GPU 基数排序、缓冲池和管道预编译以实现实时性能。 标注: 标注员在重建环境中导航并直接在场景中放置 3D 标注。分类标签可以应用于整个场景或单独的区域。 支持格式: Gaussian Splat 使用场景: 3D 场景理解、新视角合成标注、空间 AI 训练数据、环境映射。

能力对比

下表展示每种数据类型的可视化和标注能力:
能力图像视频点云MCAPSplat
可视化
2D 图像查看器
3D 点云查看器
3D Splat 查看器
多面板布局
时间轴回放
可视化模式(6 种)
标注
边界框
多边形
3D 长方体
分割
折线
关键点
分类
目标跟踪

上传要求

属性限制
最大文件大小(图像)每个文件 20 MB
最大文件大小(视频)每个文件 2 GB
最大文件大小(点云)每个文件 500 MB
最大文件大小(MCAP)每个文件 5 GB
支持的图像格式JPEG、PNG、WebP、BMP
支持的视频格式MP4、MOV
支持的点云格式PCD、PLY
支持的多传感器格式MCAP
上传限制可能因您的计划而异。如果您需要上传超出这些限制的文件,请联系 support@avala.ai

下一步

管理数据集

在 Mission Control 中上传、组织和管理您的数据。

MCAP / ROS 集成

使用 MCAP 和 ROS 设置多传感器数据管道。

核心概念

了解查看器、面板、布局和其他平台概念。

架构

了解可视化引擎和后端服务如何协同工作。