跳转到主要内容
本页概述 Avala 平台的组织方式及其组件之间的交互。 Avala 系统架构

系统概述

Mission Control

Web 界面,位于 avala.ai——可视化、标注、项目管理、质量控制、数据集管理

可视化引擎

GPU 加速渲染——多传感器查看器、3D 点云查看器、Gaussian Splat 查看器、WebGPU/WebGL 渲染管道

REST API

api.avala.ai/api/v1——数据集、项目、任务、导出、组织。通过直接 HTTP/cURL、Python SDK、TypeScript SDK 或 CLI 访问。

后端服务

异步处理——MCAP 解析、视频转换、导出生成、任务处理、推理管道

存储

持久化数据——数据集文件、标注、导出、模型工件

组件

Mission Control

Mission Control 是 Avala 的 Web 应用程序,位于 avala.ai。它提供:
  • 数据可视化 — GPU 加速查看器,用于在标注之前、期间和之后探索传感器数据。多传感器回放、3D 点云渲染和 Gaussian Splat 场景导航——全部在浏览器中完成。
  • 标注编辑器 — 专门构建的工具,用于标注图像、视频、点云和多传感器数据,支持边界框、多边形、长方体、分割、折线和关键点。
  • 项目管理 — 创建和配置标注项目,定义标签分类体系,分配工作给团队成员,并监控进度。
  • 质量控制 — 审核已提交的标注,标记问题,跟踪通过率,运行共识工作流。
  • 数据集管理 — 上传数据,将项组织为序列,浏览和搜索数据集,管理访问权限。

可视化引擎

可视化引擎在浏览器中运行,为传感器数据提供 GPU 加速渲染:
  • 多传感器查看器 — MCAP 和 ROS 录制的同步回放,支持八种面板类型:图像、3D / 点云、图表、原始消息、日志、地图、仪表盘和状态转换。自动 topic 检测和智能布局组合根据您的数据排列面板。
  • 3D 点云查看器 — 使用六种可视化模式(中性、强度、彩虹、标签、全景、图像投影)渲染 LiDAR 数据。鸟瞰视图、透视视图和侧视图。WebGPU 计算着色器处理视锥体裁剪和细节层次渲染,在密集扫描上保持高帧率。
  • Gaussian Splat 查看器 — WebGPU 加速渲染 3D Gaussian Splat 场景重建。GPU 基数排序、缓冲池和管道预编译提供逼真环境中的实时导航。
  • 渲染管道 — 优先使用 WebGPU,自动回退到 WebGL 以获得更广泛的浏览器支持。功能标志控制计算着色器、渲染包和 WGSL 着色器编译。
  • 多窗口布局 — 可配置的面板排列,支持拖放。基于树的布局系统具有自动平衡功能,让您自定义面板的组织方式,或让布局组合器从您的数据构建优化的排列。
可视化引擎不需要插件或下载。它原生运行在 Chrome 113+、Edge 113+ 和其他支持 WebGPU 的浏览器中,旧版浏览器使用 WebGL 回退。

REST API

REST API 位于 api.avala.ai/api/v1,提供对每种平台能力的编程访问。所有请求通过 X-Avala-Api-Key 头中传递的 API 密钥进行认证。 核心资源:
资源描述
数据集创建、列出和管理数据集及其项
项目配置标注工作流、标签分类体系和任务设置
任务分配、跟踪和管理单个标注工作单元
导出生成和下载各种格式的标注数据
组织管理团队、成员、角色和权限
API 遵循 REST 约定,使用 JSON 请求和响应体、基于游标的分页和标准 HTTP 状态码。

SDK

您可以使用标准 HTTP 客户端从任何语言直接调用 REST API(参阅 REST API),或使用官方 SDK:
  • Python SDKpip install avala)— 同步和异步客户端、Pydantic 模型、自动分页、类型化异常、CLI 工具。
  • TypeScript SDKnpm install @avala-ai/sdk)— 完全类型化的客户端,基于 Promise 的 API,适用于 Node.js 和边缘运行时。
  • CLIcurl -fsSL https://avala.ai/install.sh | bash)— 从终端管理数据集、项目、导出和存储。
详情请参阅 SDK 概览

后端服务

后端服务处理驱动平台的异步处理:
  • MCAP 解析 — 从 MCAP 录制中提取和同步传感器流,检测消息类型,并为多传感器查看器构建帧索引。
  • 视频转换 — 将上传的视频文件拆分为帧序列,用于可视化和标注。
  • 导出生成 — 生成 JSON、COCO、KITTI 和其他格式的可下载导出。
  • 任务处理 — 根据项目配置生成和分发标注任务。
  • 推理管道 — 运行模型推理,用于 AI 辅助标注和预标注。

存储

存储管理所有持久化数据:
  • 数据集文件 — 原始图像、视频帧、点云和 MCAP 录制。
  • 标注 — 标注员生成的标注数据(边界框、多边形、长方体、蒙版)。
  • 导出 — 生成的可供下载的导出文件。
  • 模型工件 — 用于 AI 辅助标注的推理模型的权重和配置。

MCP 服务器

MCP(Model Context Protocol)服务器将 Avala 工具暴露给 Claude、Cursor 和 VS Code Copilot 等 AI 助手。它支持在不离开开发环境的情况下通过自然语言与数据集、项目和导出进行交互。
@avala-ai/mcp-server 包可在 npm 上获取。使用 npm install -g @avala-ai/mcp-server 或使用 npx 安装。详情请参阅 MCP 设置指南

组件如何交互

  1. 用户通过 Mission Control(Web 界面)或通过 REST API 和 SDK 以编程方式与 Avala 交互。
  2. Mission Control 通过 REST API 加载数据,并使用可视化引擎直接在浏览器中渲染——不需要服务器端渲染。
  3. 所有客户端界面与同一个 REST API 通信,因此在 Mission Control 中执行的操作可通过 API 立即可见,反之亦然。
  4. REST API 验证请求,管理资源,并将工作分派给后端服务进行异步处理。
  5. 后端服务处理任务(MCAP 解析、视频转换、导出生成)并将结果写回存储。

下一步

API 参考

基础 URL、认证、端点和响应格式。

与 AI 一起使用 Avala

通过 MCP 将 Avala 连接到 Claude、Cursor 和 VS Code。

数据类型

每种数据类型的可视化能力和标注工具。

核心概念

查看器、面板、布局、时间轴和其他平台概念。