はじめに - Avala Documentation

Avala は、ロボティクス、自動運転車、Physical AI チームがセンサーデータの可視化、探索、アノテーションをすべて一つの場所で行えるプラットフォームです。 MCAP レコーディング、LiDAR スキャン、カメラフィード、Gaussian Splat シーンをアップロードできます。GPU アクセラレーションによるマルチセンサービューアで、同期されたタイムラインと設定可能なパネルレイアウトを使って再生できます。ラベリングの準備ができたら、同じデータ上でアノテーションモードに切り替えられます — エクスポート、ツール切り替え、再アップロードは不要です。プラットフォームは、生のセンサーデータからラベル付きトレーニングデータセットまでの全ライフサイクルを管理します。

Avala を使う方

自動運転車チーム — カメラ画像、LiDAR ポイントクラウド、同期されたマルチセンサーレコーディングを、知覚モデルのトレーニング用にラベリングできます。マルチカメラプロジェクションで MCAP/ROS データを可視化・デバッグできます。
ロボティクス企業 — ナビゲーション、マニピュレーション、シーン理解のための知覚データをアノテーションできます。GPU アクセラレーションレンダリングで 3D ポイントクラウドを探索できます。
Physical AI / 空間コンピューティングチーム — 3D 世界理解やシミュレーションから現実への転移のために、Gaussian Splat シーン、高密度ポイントクラウド、マルチモーダルセンサーデータを扱えます。
AI/ML チーム — 画像、動画、3D データにわたる物体検出、セグメンテーション、分類、トラッキングのためのトレーニングデータセットを作成できます。
研究機関 — プロフェッショナルなアノテーションツールと品質管理ワークフローを使って、コンピュータビジョンと 3D 知覚研究のためのラベル付きデータセットを構築できます。

プラットフォームの機能

ビジュアライゼーション

Avala のビジュアライゼーションエンジンは、WebGPU と WebGL を活用してブラウザ上で完全に動作します。

マルチセンサー MCAP/ROS 再生 — カメラ、LiDAR、レーダー、IMU データを含む MCAP ファイルを開けます。ビューアはトピックを自動検出し、8 種類のパネル（画像、3D / ポイントクラウド、プロット、生メッセージ、ログ、マップ、ゲージ、ステート遷移）に割り当てます。
GPU アクセラレーション 3D ポイントクラウドレンダリング — 6 種類の可視化モード（ニュートラル、インテンシティ、レインボー、ラベル、パノプティック、画像プロジェクション）でポイントクラウドをレンダリングします。WebGPU コンピュートシェーダーが GPU 上で視錐台カリングとレベルオブディテール選択を処理します。
Gaussian Splat ビューア — WebGPU アクセラレーションによる Gaussian Splat ビューアで、3D シーン再構成をシーン階層、プロパティパネル、統計オーバーレイと共に検査できます。
マルチカメラ同期再生 — LiDAR からカメラへのプロジェクションオーバーレイを使って、複数のカメラストリームを同期して表示できます。ピンホールモデルとダブルスフィア（フィッシュアイ）カメラモデルの両方をサポートしています。
設定可能なマルチウィンドウレイアウト — ドラッグ&ドロップによるパネル配置とリサイズ可能な分割ビュー。デフォルトレイアウトでは、トピックサイドバー、コンテンツパネル、ファイル情報パネルが水平ルート構成で配置されます。
タイムラインベースのナビゲーション — すべての同期されたセンサーストリームにわたるフレームステッピング、タイムスタンプシーキング、再生速度制御が可能です。

アノテーション

すべてのデータモダリティに対応したプロフェッショナルなアノテーションツールで、品質管理とチームワークフローに対応しています。

バウンディングボックス — 物体検出のための 2D 矩形領域
ポリゴン — 正確な物体境界のための任意形状
3D キュボイド — ポイントクラウドおよびマルチセンサーデータにおける 3D バウンディングボックス（バードアイビュー、パースペクティブビュー、サイドビュー付き）
セグメンテーション — ピクセルレベルの分類マスク
ポリライン — パス、車線、エッジのアノテーション
キーポイント — ランドマークおよびポーズアノテーション
分類 — シーンレベルおよびオブジェクトレベルの属性ラベル

品質管理には、マルチステージレビューワークフロー、アノテーション課題トラッキング、アノテーター間一致度メトリクス、コンセンサスワークフローが含まれます。オブジェクトトラッキングは、動画やシーケンスフレーム全体で一貫した ID を提供します。ドメインに特化したプロのアノテーターが必要なチーム向けに、マネージドラベリングサービスも利用可能です。

サポートされるデータタイプ

Avala は 5 つのデータモダリティを扱い、それぞれに専用のビジュアライゼーションとアノテーションワークフローが用意されています。

データタイプ	フォーマット	説明
画像	JPEG, PNG, WebP	単一フレームのビジュアライゼーションと、すべての 2D ツールによるアノテーション
動画	MP4, MOV	フレームシーケンスに変換され、再生、フレーム単位のアノテーション、オブジェクトトラッキングが可能
ポイントクラウド	PCD, PLY	GPU アクセラレーションレンダリングとキュボイドアノテーション対応の 3D LiDAR スキャン
MCAP / ROS	MCAP	カメラ、LiDAR、レーダー、IMU データを含むマルチセンサーコンテナ。マルチパネル再生とマルチカメラプロジェクション対応
Splat	Gaussian Splat	WebGPU レンダリングによる Gaussian Splat 環境での 3D シーンビジュアライゼーションとアノテーション

SDK

Python SDK

pip install avala でインストール — 完全な型ヒントと非同期サポート付きです。

TypeScript SDK

npm install @avala-ai/sdk でインストール — Node.js とブラウザで動作します。

プラットフォームを探索

ビジュアライゼーション

GPU アクセラレーションによるマルチセンサービューアで、8種類のパネル、6種類のポイントクラウドレンダリングモード、Gaussian Splat をサポートしています。

アノテーション

2D、3D、動画、マルチセンサーデータに対応したプロフェッショナルなアノテーションツールと品質管理機能です。

インテグレーション

S3、MCP、MCAP/ROS、ウェブフック、推論パイプラインと接続できます。

次のステップ

クイックスタート

60秒以内に最初のアノテーションプロジェクトを作成できます。

基本コンセプト

データセット、プロジェクト、タスク、アノテーションライフサイクルを理解できます。

ビジュアライゼーション

マルチセンサービューア、3D ポイントクラウドレンダラー、Gaussian Splat ビューアを探索できます。

SDK

Python または TypeScript SDK をインストールして構築を始められます。

​Avala を使う方

​プラットフォームの機能

​ビジュアライゼーション

​アノテーション

​サポートされるデータタイプ

​SDK

Python SDK

TypeScript SDK

​プラットフォームを探索

​次のステップ

クイックスタート

基本コンセプト

ビジュアライゼーション

SDK

Avala を使う方

プラットフォームの機能

ビジュアライゼーション

アノテーション

サポートされるデータタイプ

SDK

プラットフォームを探索

次のステップ