このページでは、Avala プラットフォームの構成要素であるビジュアライゼーション、アノテーション、データセット、プロジェクト、タスク、組織、ラベル、品質管理、シーケンスについて説明します。これらのコンセプトを理解することで、Physical AI のための効果的なデータワークフローを設計できます。
ビジュアライゼーション
Avala は、ブラウザ上でセンサーデータの GPU アクセラレーションビジュアライゼーションを提供します。これらのコンセプトは、すべてのビジュアライゼーション機能に共通します。
ビューア
Avala には、データタイプごとに特化したビューアがあります。マルチセンサービューアは、すべてのセンサーストリームの同期再生により MCAP および ROS レコーディングを処理します。3D ポイントクラウドビューアは、6つの可視化モードで LiDAR データをレンダリングします。Gaussian Splat ビューアは、WebGPU を使用してフォトリアリスティックな 3D シーン再構成をレンダリングします。
パネル
マルチセンサービューアは、データをパネルに整理します — 異なるデータストリーム用の独立したビジュアライゼーションウィンドウです。Avala は 8 種類のパネルをサポートしています:
| パネルタイプ | 説明 |
|---|
| 画像 | カメラフレームと画像ストリーム |
| 3D / ポイントクラウド | LiDAR スキャンと 3D ジオメトリ |
| プロット | 時系列データと数値信号 |
| 生メッセージ | デコードされたメッセージペイロード |
| ログ | テキストログストリーム |
| マップ | 地理的位置と軌跡 |
| ゲージ | リアルタイム数値表示 |
| ステート遷移 | 時間経過に伴う離散的な状態変化 |
トピックはスキーマに基づいて自動的にパネルに割り当てられます。
レイアウト
マルチウィンドウレイアウトは、設定可能なグリッドにパネルを配置します。レイアウトコンポーザーは、データ内のトピックに基づいて最適化された配置を自動的に構築します。また、パネルをドラッグ、リサイズ、再配置して手動でレイアウトをカスタマイズすることもできます。
タイムライン
ビューア内のすべてのパネルは同期されたタイムラインを共有します。フレーム単位でナビゲートし、特定のタイムスタンプにスクラブし、設定可能な速度でレコーディングを再生できます。タイムラインは、個々のキャプチャ周波数に関係なく、すべてのセンサーストリームを同期します。
センサーストリーム
MCAP レコーディングには複数のセンサーストリーム(トピック)が含まれます。各トピックは特定のデータタイプ — 画像、ポイントクラウド、IMU リーディング、GPS 座標 — を独自の周波数で伝送します。Avala はすべてのストリームをタイムスタンプで同期するため、任意の時点でのセンサー全体像を確認できます。
可視化モード
ポイントクラウドデータは 6 つのモードで色付けできます:
| モード | 説明 |
|---|
| ニュートラル | 単一の均一色 |
| インテンシティ | 反射強度による色付け |
| レインボー | 時間的または連続的な色付け |
| ラベル | セマンティッククラスによる色付け |
| パノプティック | インスタンスアイデンティティによる色付け |
| 画像プロジェクション | 投影されたカメラ画像によるテクスチャ |
可視化モードは 3D ポイントクラウドビューアに適用され、スタンドアロンの LiDAR データセットと MCAP レコーディング内のポイントクラウドストリームの両方で動作します。
データセット
データセットは、ビジュアライゼーションとアノテーションの原材料となるデータアイテム(画像、動画フレーム、ポイントクラウド、マルチセンサーレコーディング)のコレクションです。
データセットのプロパティ
| プロパティ | 説明 |
|---|
name | 人間が読める名前 |
slug | URL に適した識別子(オーナーの名前空間内で一意) |
data_type | データの種類: image, video, lidar, mcap, image_3d, splat |
visibility | public または private |
owner | データセットを所有するユーザーまたは組織 |
item_count | データセット内のデータアイテムの総数 |
データアイテム
各データセットにはアイテム — 個々のデータサンプルが含まれます:
- 画像データセット — 各アイテムは単一の画像ファイルです。
- 動画データセット — アイテムは動画フレームで、シーケンスにグループ化されます。
- LiDAR データセット — アイテムは個々のポイントクラウドスキャンです。
- MCAP データセット — アイテムには同期されたマルチセンサーフレーム(カメラ + LiDAR + IMU)が含まれます。
シーケンス
シーケンスは、時系列またはマルチフレームデータのために関連するアイテムをグループ化します:
- 同じレコーディングの動画フレーム
- 連続する走行セッションの LiDAR スキャン
- 連続するタイムスタンプでの同期マルチカメラキャプチャ
シーケンスにより、フレーム単位のナビゲーション、フレーム間のオブジェクトトラッキング、アノテーションの時間的一貫性が実現されます。
シーケンスのステータスワークフロー:
uploading → processing → ready → failed
プロジェクト
プロジェクトは、1つ以上のデータセットを特定のタスクタイプ、ラベルタクソノミー、品質管理設定に接続することで、アノテーションワークフローを定義します。
プロジェクトのコンポーネント
Project
├── Datasets(データソース)
├── Task Type(アノテーション方法)
├── Label Config(オブジェクトクラス、属性)
├── Quality Control(レビューステージ、コンセンサス)
└── Tasks(個々の作業単位)
タスクタイプ
プロジェクトは以下のタスクタイプのいずれかで設定されます:
| タスクタイプ | API 値 | 説明 |
|---|
| 画像アノテーション | image-annotation | 単一画像への 2D アノテーション(ボックス、ポリゴン、セグメンテーション、キーポイント) |
| 動画アノテーション | video-annotation | フレーム間のオブジェクトトラッキング付きフレーム単位のアノテーション |
| ポイントクラウドアノテーション | point-cloud-annotation | LiDAR スキャンへの 3D アノテーション(キュボイド、セグメンテーション) |
| ポイントクラウドオブジェクト | point-cloud-objects | 3D ポイントクラウドシーケンスでのオブジェクトレベルアノテーション |
プロジェクトのステータス
| ステータス | 説明 |
|---|
pending-approval | 開始の承認待ち |
active | アノテーション作業を受け付け中 |
paused | 一時停止中 |
canceled | 永久に停止 |
archived | 完了してアーカイブ済み |
completed | すべてのアノテーションタスクが完了 |
タスク
タスクは、プロジェクト内の個々の作業単位です。各タスクは、1人のアノテーターが 1つ以上のデータアイテムに対して行うアノテーション作業を表します。
タスクのライフサイクル
タスクは以下の状態を経て進行します:
pending → assigned → in_progress → submitted → under_review → approved
→ rejected → rework
| ステータス | 説明 |
|---|
pending | 作成済みだがアノテーターに未割り当て |
assigned | アノテーターに割り当て済み、開始待ち |
in_progress | アノテーターが積極的に作業中 |
submitted | アノテーターがレビューのために作業を提出済み |
under_review | レビュアーが提出されたアノテーションを検査中 |
approved | アノテーションが承認済み — タスク完了 |
rejected | アノテーションがレビューを通過しなかった |
rework | 修正のためアノテーターに返却 |
アノテーターがタスクを完了すると、以下を含む結果を提出します:
- アノテーションデータ(バウンディングボックス、ポリゴン、キュボイド、セグメンテーションマスクなど)
- メタデータ(所要時間、ツールバージョン)
結果は最終承認前に品質管理レビューを受けます。
組織は、チームベースのコラボレーションのためにユーザーとリソースをグループ化します。
組織の構造
Organization
├── Members(ロール付きユーザー)
├── Datasets(共有データ)
├── Projects(共有ワークフロー)
└── Settings(請求、API キー、権限)
メンバーロール
| ロール | 権限 |
|---|
owner | 完全な制御 — 請求、設定、組織の削除が可能 |
admin | メンバー管理、リソースの作成と設定 |
member | 共有リソースへのアクセス、アノテーション作業の実行 |
ラベルとタクソノミー
ラベル設定
プロジェクトはラベル設定を定義します — アノテーターがアノテーションに割り当てる事前定義されたオブジェクトクラスのセットです:
{
"labels": [
{ "name": "car", "color": "#FF0000" },
{ "name": "pedestrian", "color": "#00FF00" },
{ "name": "cyclist", "color": "#0000FF" }
]
}
より複雑なタクソノミーのために、プロジェクトは以下を定義する分類設定を含めることができます:
- 属性 — 色、オクルージョンレベル、切断などのプロパティで、アノテーターが各オブジェクトに割り当てます。
- 階層的カテゴリ — ネストされたクラス構造(例:Vehicle > Car > Sedan)。
- 条件付き属性 — 特定のオブジェクトクラスに対してのみ表示される属性。
アノテーションタイプ
Avala は以下のアノテーションタイプをサポートしており、それぞれが特定のラベリングタスク用に設計されています:
| タイプ | 説明 | データタイプ |
|---|
| バウンディングボックス | オブジェクト周囲の 2D 矩形領域 | 画像、動画 |
| ポリゴン | オブジェクト境界をトレースする任意の閉じた形状 | 画像、動画 |
| 3D キュボイド | 位置、寸法、回転を持つ 3D バウンディングボックス | ポイントクラウド、MCAP |
| セグメンテーション | ピクセルレベルの分類マスク | 画像、動画 |
| ポリライン | 車線、エッジ、境界のためのオープンパス | 画像、動画 |
| キーポイント | ポーズ推定と構造のためのランドマークポイント | 画像、動画 |
| 分類 | シーンレベルまたはオブジェクトレベルのカテゴリラベル | すべてのデータタイプ |
品質管理
Avala は、アノテーションの精度と一貫性を確保するための品質保証ツールを内蔵しています。
レビュー
アノテーションは承認前にレビューステージを通過します:
- アノテーターが結果を提出します。
- レビュアーがアノテーションを検査します。
- レビュアーが正しい作業を承認するか、修正が必要な作業を却下します。
- 却下されたタスクは修正のためアノテーターに返却されます。
アノテーション課題により、レビュアーは個々のアノテーションの特定の問題をフラグ付けできます:
- シーン内の特定のオブジェクトまたは領域に課題をピン留めできます。
- チームメンバーに課題を割り当てて解決を依頼できます。
- 課題のステータス(オープン、解決済み)を追跡できます。
メトリクス
内蔵メトリクスでアノテーション品質を監視します:
- 承認率 — 初回提出で承認されたタスクの割合。
- アノテーション時間 — タスクあたりの平均所要時間。
- アノテーター間一致度 — 同じデータに対するアノテーター間の一貫性。
- 課題頻度 — タスクあたりのフラグ付き問題の割合。
コンセンサス
コンセンサスワークフローは、同じデータを複数のアノテーターに独立して割り当て、結果を比較して一致度を測定し、曖昧なケースを特定します。
品質メトリクスは、トレーニングの必要性を特定し、チーム全体で一貫したアノテーション基準を維持するのに役立ちます。
シーケンス
シーケンスは、時間的または空間的な進行を表すデータアイテムの順序付きコレクションです — 動画フレーム、LiDAR スイープ、マルチセンサーレコーディングなど。
プロパティ
| プロパティ | 説明 |
|---|
name | シーケンス識別子 |
frame_count | シーケンス内のフレーム数 |
status | シーケンスの処理ステータス |
data_type | 親データセットから継承 |
ステータスワークフロー
シーケンスは、データのアップロードと処理に伴い、以下のステータスを経て進行します:
uploading → processing → ready
→ failed
- uploading — フレームがプラットフォームにアップロード中です。
- processing — フレームが検証され、アノテーション用に準備されています。
- ready — すべてのフレームが処理され、アノテーションに利用可能です。
- failed — 処理でエラーが発生しました(個々のフレームステータスを確認してください)。
フリート管理
フリート管理はプレビュー版です。ここで説明されている機能は変更される可能性があります。
Avala のフリート管理機能により、ロボットフリート全体のデバイス、レコーディング、テレメトリを大規模に管理できます。
デバイス
デバイスは、フリート内の物理的なロボット、センサーリグ、またはコンピュートユニットを表します。各デバイスには dev_ プレフィックス付きの一意の識別子があり、タイプ、ファームウェアバージョン、ステータス(online、offline、maintenance)などのメタデータを追跡します。
レコーディング
デバイスはレコーディング — 運用中にキャプチャされた MCAP ファイルを生成します。レコーディングはソースデバイスに自動的に関連付けられ、デバイス、日付、ステータス、タグでフィルタリングできます。
イベント
イベントは、レコーディング上のタイムスタンプ付きマーカーです:エラー、状態変化、異常、カスタムアノテーション。イベントは MCAP ビューアのタイムラインに表示され、フリート全体で照会できます。
レコーディングルール
レコーディングルールは、条件に基づいてレコーディングを自動的に評価し、一致した場合にアクション(タグ付け、レビュー用フラグ、通知)を実行します。ルールはしきい値、パターン、頻度、データ不在などでトリガーできます。
アラート
アラートは、フリートの状態が変化したときにチームに通知します。アラートを Slack、メール、ウェブフック、アプリ内通知にルーティングできます。アラートは open → acknowledged → resolved のライフサイクルに従います。
次のステップ
データタイプ
各データタイプのサポートされるフォーマット、ビジュアライゼーション機能、アノテーションツール。
アノテーション
ビジュアライゼーション、アノテーション、プロジェクト管理のためのウェブインターフェースについて学べます。
アーキテクチャ
ビジュアライゼーションエンジンを含む Avala プラットフォームのコンポーネントの連携方法。
API 認証
API キーを設定し、認証済みリクエストを開始できます。
フリートダッシュボード
ロボットフリート全体のデバイス、レコーディング、テレメトリを管理できます。