谁在使用 Avala
- 自动驾驶团队 — 标注摄像头图像、LiDAR 点云和同步的多传感器录制数据,用于感知模型训练。通过多摄像头投影可视化和调试 MCAP/ROS 数据。
- 机器人公司 — 标注导航、操作和场景理解的感知数据。使用 GPU 加速渲染探索 3D 点云。
- Physical AI / 空间计算团队 — 处理 Gaussian Splat 场景、密集点云和多模态传感器数据,用于 3D 世界理解和仿真到现实的迁移。
- AI/ML 团队 — 在图像、视频和 3D 数据上创建目标检测、分割、分类和跟踪的训练数据集。
- 研究实验室 — 使用专业标注工具和质量控制工作流为计算机视觉和 3D 感知研究构建标注数据集。
平台能力
可视化
Avala 的可视化引擎完全在浏览器中运行,由 WebGPU 和 WebGL 驱动。- 多传感器 MCAP/ROS 回放 — 打开包含摄像头、LiDAR、雷达和 IMU 数据的 MCAP 文件。查看器自动检测 topic 并分配面板类型,支持 8 种面板类型:图像、3D / 点云、图表、原始消息、日志、地图、仪表盘和状态转换。
- GPU 加速 3D 点云渲染 — 使用 6 种可视化模式渲染点云:中性、强度、彩虹、标签、全景和图像投影。WebGPU 计算着色器在 GPU 上处理视锥体裁剪和细节层次选择。
- Gaussian Splat 查看器 — 在 WebGPU 加速的 Gaussian Splat 查看器中检查 3D 场景重建,支持场景层次结构、属性面板和统计信息叠加。
- 多摄像头同步回放 — 同步查看多个摄像头流,支持 LiDAR 到摄像头投影叠加。支持针孔和双球面(鱼眼)摄像头模型。
- 可配置的多窗口布局 — 拖放式面板排列,可调整大小的分割视图。默认布局在水平根配置中放置 topic 侧边栏、内容面板和文件信息面板。
- 基于时间轴的导航 — 在所有同步传感器流中进行逐帧步进、时间戳搜索和播放速度控制。
标注
专业标注工具适用于每种数据模态,配备质量控制和团队工作流。- 边界框 — 用于目标检测的 2D 矩形区域
- 多边形 — 用于精确对象边界的任意形状
- 3D 长方体 — 点云和多传感器数据中的 3D 边界框,支持鸟瞰、透视和侧视图
- 分割 — 像素级分类蒙版
- 折线 — 路径、车道和边缘标注
- 关键点 — 地标和姿态标注
- 分类 — 场景级和对象级属性标签
支持的数据类型
Avala 处理五种数据模态,每种都有专门构建的可视化和标注工作流:| 数据类型 | 格式 | 描述 |
|---|---|---|
| 图像 | JPEG、PNG、WebP | 单帧可视化和标注,支持所有 2D 工具 |
| 视频 | MP4、MOV | 转换为帧序列,用于回放、逐帧标注和目标跟踪 |
| 点云 | PCD、PLY | 3D LiDAR 扫描,支持 GPU 加速渲染和长方体标注 |
| MCAP / ROS | MCAP | 包含摄像头、LiDAR、雷达和 IMU 数据的多传感器容器;多面板回放和多摄像头投影 |
| Splat | Gaussian Splat | 在 WebGPU 渲染的 Gaussian Splat 环境中进行 3D 场景可视化和标注 |
SDK
Python SDK
使用
pip install avala 安装——完整的类型提示和异步支持。TypeScript SDK
使用
npm install @avala-ai/sdk 安装——适用于 Node.js 和浏览器。探索平台
可视化
GPU 加速的多传感器查看器,支持 8 种面板类型、6 种点云渲染模式和 Gaussian Splat。
标注
专业标注工具,支持 2D、3D、视频和多传感器数据的质量控制。
集成
连接 S3、MCP、MCAP/ROS、Webhook 和推理管道。
下一步
快速开始
在 60 秒内创建您的第一个标注项目。
核心概念
了解数据集、项目、任务和标注生命周期。
可视化
探索多传感器查看器、3D 点云渲染器和 Gaussian Splat 查看器。
SDK
安装 Python 或 TypeScript SDK 并开始构建。