Avala を使う方
- 自動運転車チーム — カメラ画像、LiDAR ポイントクラウド、同期されたマルチセンサーレコーディングを、知覚モデルのトレーニング用にラベリングできます。マルチカメラプロジェクションで MCAP/ROS データを可視化・デバッグできます。
- ロボティクス企業 — ナビゲーション、マニピュレーション、シーン理解のための知覚データをアノテーションできます。GPU アクセラレーションレンダリングで 3D ポイントクラウドを探索できます。
- Physical AI / 空間コンピューティングチーム — 3D 世界理解やシミュレーションから現実への転移のために、Gaussian Splat シーン、高密度ポイントクラウド、マルチモーダルセンサーデータを扱えます。
- AI/ML チーム — 画像、動画、3D データにわたる物体検出、セグメンテーション、分類、トラッキングのためのトレーニングデータセットを作成できます。
- 研究機関 — プロフェッショナルなアノテーションツールと品質管理ワークフローを使って、コンピュータビジョンと 3D 知覚研究のためのラベル付きデータセットを構築できます。
プラットフォームの機能
ビジュアライゼーション
Avala のビジュアライゼーションエンジンは、WebGPU と WebGL を活用してブラウザ上で完全に動作します。- マルチセンサー MCAP/ROS 再生 — カメラ、LiDAR、レーダー、IMU データを含む MCAP ファイルを開けます。ビューアはトピックを自動検出し、8 種類のパネル(画像、3D / ポイントクラウド、プロット、生メッセージ、ログ、マップ、ゲージ、ステート遷移)に割り当てます。
- GPU アクセラレーション 3D ポイントクラウドレンダリング — 6 種類の可視化モード(ニュートラル、インテンシティ、レインボー、ラベル、パノプティック、画像プロジェクション)でポイントクラウドをレンダリングします。WebGPU コンピュートシェーダーが GPU 上で視錐台カリングとレベルオブディテール選択を処理します。
- Gaussian Splat ビューア — WebGPU アクセラレーションによる Gaussian Splat ビューアで、3D シーン再構成をシーン階層、プロパティパネル、統計オーバーレイと共に検査できます。
- マルチカメラ同期再生 — LiDAR からカメラへのプロジェクションオーバーレイを使って、複数のカメラストリームを同期して表示できます。ピンホールモデルとダブルスフィア(フィッシュアイ)カメラモデルの両方をサポートしています。
- 設定可能なマルチウィンドウレイアウト — ドラッグ&ドロップによるパネル配置とリサイズ可能な分割ビュー。デフォルトレイアウトでは、トピックサイドバー、コンテンツパネル、ファイル情報パネルが水平ルート構成で配置されます。
- タイムラインベースのナビゲーション — すべての同期されたセンサーストリームにわたるフレームステッピング、タイムスタンプシーキング、再生速度制御が可能です。
アノテーション
すべてのデータモダリティに対応したプロフェッショナルなアノテーションツールで、品質管理とチームワークフローに対応しています。- バウンディングボックス — 物体検出のための 2D 矩形領域
- ポリゴン — 正確な物体境界のための任意形状
- 3D キュボイド — ポイントクラウドおよびマルチセンサーデータにおける 3D バウンディングボックス(バードアイビュー、パースペクティブビュー、サイドビュー付き)
- セグメンテーション — ピクセルレベルの分類マスク
- ポリライン — パス、車線、エッジのアノテーション
- キーポイント — ランドマークおよびポーズアノテーション
- 分類 — シーンレベルおよびオブジェクトレベルの属性ラベル
サポートされるデータタイプ
Avala は 5 つのデータモダリティを扱い、それぞれに専用のビジュアライゼーションとアノテーションワークフローが用意されています。| データタイプ | フォーマット | 説明 |
|---|---|---|
| 画像 | JPEG, PNG, WebP | 単一フレームのビジュアライゼーションと、すべての 2D ツールによるアノテーション |
| 動画 | MP4, MOV | フレームシーケンスに変換され、再生、フレーム単位のアノテーション、オブジェクトトラッキングが可能 |
| ポイントクラウド | PCD, PLY | GPU アクセラレーションレンダリングとキュボイドアノテーション対応の 3D LiDAR スキャン |
| MCAP / ROS | MCAP | カメラ、LiDAR、レーダー、IMU データを含むマルチセンサーコンテナ。マルチパネル再生とマルチカメラプロジェクション対応 |
| Splat | Gaussian Splat | WebGPU レンダリングによる Gaussian Splat 環境での 3D シーンビジュアライゼーションとアノテーション |
SDK
Python SDK
pip install avala でインストール — 完全な型ヒントと非同期サポート付きです。TypeScript SDK
npm install @avala-ai/sdk でインストール — Node.js とブラウザで動作します。プラットフォームを探索
ビジュアライゼーション
GPU アクセラレーションによるマルチセンサービューアで、8種類のパネル、6種類のポイントクラウドレンダリングモード、Gaussian Splat をサポートしています。
アノテーション
2D、3D、動画、マルチセンサーデータに対応したプロフェッショナルなアノテーションツールと品質管理機能です。
インテグレーション
S3、MCP、MCAP/ROS、ウェブフック、推論パイプラインと接続できます。
次のステップ
クイックスタート
60秒以内に最初のアノテーションプロジェクトを作成できます。
基本コンセプト
データセット、プロジェクト、タスク、アノテーションライフサイクルを理解できます。
ビジュアライゼーション
マルチセンサービューア、3D ポイントクラウドレンダラー、Gaussian Splat ビューアを探索できます。
SDK
Python または TypeScript SDK をインストールして構築を始められます。