データタイプ - Avala Documentation

Avala は 5 つのデータモダリティをサポートしており、それぞれに GPU アクセラレーションビジュアライゼーションと専用のアノテーションワークフローが用意されています。このページでは、各タイプで何を表示でき、何にラベルを付けられ、どのフォーマットがサポートされているかを説明します。

画像

ビジュアライゼーション： 画像は、パン、ズーム、ピクセルレベルの検査が可能な画像ビューアで表示されます。MCAP レコーディングの一部である場合、画像は他のセンサーストリームと同期された専用の画像パネルに表示されます。 アノテーション： 各画像は単一フレームとして独立してアノテーションされます。7つの 2D アノテーションツールすべてが利用可能です：バウンディングボックス、ポリゴン、セグメンテーションマスク、ポリライン、キーポイント、分類、オブジェクトトラッキング（動画シーケンスの場合）。 サポートされるフォーマット： JPEG, PNG, WebP, BMP ユースケース： 物体検出、インスタンスセグメンテーション、セマンティックセグメンテーション、画像分類、キーポイント検出、ポーズ推定。

動画

ビジュアライゼーション： 動画はアップロード時に自動的にフレームシーケンスに変換され、タイムラインスクラブによるフレーム単位の再生が可能になります。フレームを前後にナビゲートし、特定のタイムスタンプにジャンプし、設定可能な速度で再生できます。 アノテーション： アノテーターはタイムライン上でオブジェクトトラッキングを行いながらフレーム単位で作業します。オブジェクト ID はフレーム間で持続し、一貫したアイデンティティの割り当てが可能です。各フレームですべての 2D アノテーションツールが利用可能です。 サポートされるフォーマット： MP4, MOV ユースケース： オブジェクトトラッキング、行動認識、時間的イベント検出、走行シーンラベリング、行動分析。

動画処理はアップロード後にバックグラウンドで行われます。大きな動画は変換に数分かかる場合があります。Mission Control または API でシーケンスステータスを監視できます。

LiDAR / ポイントクラウド

ビジュアライゼーション： ポイントクラウドは、バードアイビュー、パースペクティブビュー、サイドビューを備えた 3D ビューアでレンダリングされます。6つの可視化モードで、異なるプロパティに基づいてポイントに色を付けることができます：

モード	説明
ニュートラル	構造概要のための単一の均一色
インテンシティ	反射強度 — 反射面を強調
レインボー	時間的または連続的な色付け
ラベル	アノテーションからのセマンティッククラスによる色付け
パノプティック	個々のオブジェクトのインスタンスレベルの色付け
画像プロジェクション	ポイントクラウドに投影されたカメラ画像

ビューアは、視錐台カリングとレベルオブディテールレンダリングに WebGPU コンピュートシェーダーを使用し、密なスキャンでも高いフレームレートを維持します。 アノテーション： アノテーターは、完全な位置、寸法、回転制御が可能な 3D キュボイドを配置します。カメラキャリブレーションデータが利用可能な場合、キュボイドの投影が同期されたカメラビューに表示されます。 サポートされるフォーマット： PCD, PLY ユースケース： 3D 物体検出、自動運転知覚、ロボティクスナビゲーション、シーン再構成、HD マップ作成。

MCAP

ビジュアライゼーション： MCAP レコーディングは、最大 8 種類のパネル（画像、3D / ポイントクラウド、プロット、生メッセージ、ログ、マップ、ゲージ、ステート遷移）を備えたマルチセンサービューアで表示されます。Avala はレコーディング内のメッセージタイプを自動検出し、トピックを適切なパネルタイプに割り当てます。すべてのパネルは、カメラ、LiDAR、レーダー、IMU、その他のセンサーストリームの協調再生のための同期タイムラインを共有します。レイアウトコンポーザーは、レコーディング内のトピックに基づいて最適化されたパネル配置を自動的に構築します。手動でレイアウトをカスタマイズすることもできます。フレーム単位のナビゲーション、任意のタイムスタンプへのスクラブ、設定可能な速度でのフルレコーディングの再生が可能です。 アノテーション： Avala は MCAP ファイルを解析してセンサーストリームを抽出・同期します。カメラ画像は投影された LiDAR データと共に表示され、3D コンテキスト付きのマルチカメラアノテーションが可能です。アノテーターは、すべてのカメラビューに一貫して投影される 3D キュボイドを配置します。 サポートされるフォーマット： MCAP（ROS メッセージサポート付き） ユースケース： マルチセンサーフュージョン、サラウンドビュー知覚、自動運転車データラベリング、ロボティクスセンサーキャリブレーション、フリートデータレビュー。

MCAP サポートには、正確な LiDAR からカメラへのプロジェクションのためのカメラ内部・外部パラメータの自動抽出が含まれます。ピンホールモデルとダブルスフィア（フィッシュアイ）カメラモデルの両方がサポートされています。セットアップの詳細は MCAP / ROS インテグレーションガイドをご覧ください。

Splat

ビジュアライゼーション： Gaussian Splat シーンは、WebGPU アクセラレーション 3D ビューアでレンダリングされます。スムーズなカメラ制御でフォトリアリスティックな 3D シーン再構成を自由にナビゲートできます。レンダラーは、リアルタイムパフォーマンスのために GPU ラディックスソート、バッファプーリング、パイプラインプリコンパイルを使用します。 アノテーション： アノテーターは再構成された環境をナビゲートし、シーン内に直接 3D アノテーションを配置します。分類ラベルはシーン全体または個々の領域に適用できます。 サポートされるフォーマット： Gaussian Splat ユースケース： 3D シーン理解、新視点合成アノテーション、空間 AI トレーニングデータ、環境マッピング。

機能比較

以下の表は、各データタイプのビジュアライゼーションとアノテーション機能を示しています：

機能	画像	動画	ポイントクラウド	MCAP	Splat
ビジュアライゼーション
2D 画像ビューア	はい	はい	—	はい	—
3D ポイントクラウドビューア	—	—	はい	はい	—
3D Splat ビューア	—	—	—	—	はい
マルチパネルレイアウト	—	—	—	はい	—
タイムライン再生	—	はい	はい	はい	—
可視化モード（6種類）	—	—	はい	はい	—
アノテーション
バウンディングボックス	はい	はい	—	—	—
ポリゴン	はい	はい	—	—	—
3D キュボイド	—	—	はい	はい	はい
セグメンテーション	はい	はい	—	—	—
ポリライン	はい	はい	—	—	—
キーポイント	はい	はい	—	—	—
分類	はい	はい	はい	はい	はい
オブジェクトトラッキング	—	はい	はい	はい	—

アップロード要件

プロパティ	制限
最大ファイルサイズ（画像）	1ファイルあたり 20 MB
最大ファイルサイズ（動画）	1ファイルあたり 2 GB
最大ファイルサイズ（ポイントクラウド）	1ファイルあたり 500 MB
最大ファイルサイズ（MCAP）	1ファイルあたり 5 GB
サポートされる画像フォーマット	JPEG, PNG, WebP, BMP
サポートされる動画フォーマット	MP4, MOV
サポートされるポイントクラウドフォーマット	PCD, PLY
サポートされるマルチセンサーフォーマット	MCAP

アップロード制限はプランによって異なる場合があります。これらの制限を超えるファイルをアップロードする必要がある場合は、support@avala.ai にお問い合わせください。

次のステップ

データセット管理

Mission Control でデータをアップロード、整理、管理できます。

MCAP / ROS インテグレーション

MCAP と ROS を使ったマルチセンサーデータパイプラインを設定できます。

基本コンセプト

ビューア、パネル、レイアウト、その他のプラットフォームコンセプトを理解できます。

アーキテクチャ

ビジュアライゼーションエンジンとバックエンドサービスの連携方法を学べます。

はじめに

プラットフォーム

ユースケース

​画像

​動画

​LiDAR / ポイントクラウド

​MCAP

​Splat

​機能比較

​アップロード要件

​次のステップ

データセット管理

MCAP / ROS インテグレーション

基本コンセプト

アーキテクチャ

画像

動画

LiDAR / ポイントクラウド

MCAP

Splat

機能比較

アップロード要件

次のステップ