Ce que signifie la traçabilité dans Avala
Chaque annotation dans Avala porte des métadonnées de lignage complètes :| Entité | Ce qui est suivi |
|---|---|
| Élément de jeu de données | URL du fichier source, horodatage de téléchargement, appartenance à une séquence, métadonnées du capteur |
| Tâche | Annotateur assigné, heure de création, heure de complétion, transitions d’état |
| Résultat | Données d’annotation, outil utilisé, ID de l’annotateur, horodatage de soumission |
| Révision QA | ID du réviseur, décision de révision (accepter/rejeter/corriger), commentaires de révision |
| Export | Format d’export, jeux de données/projets/slices inclus, horodatage de création, version |
Démonstration : Débogage d’une défaillance de modèle
Voici un exemple concret de comment la traçabilité vous aide à déboguer un problème de modèle en production.1. Le modèle échoue sur un cas limite
Votre modèle de perception classifie mal un piéton partiellement occulté dans un scan LiDAR. Vous identifiez la prédiction et voulez comprendre pourquoi le modèle a appris ce comportement.2. Trouver les données d’entraînement
Utilisez le SDK pour rechercher dans vos exports les éléments de jeu de données qui ont contribué à l’ensemble d’entraînement du modèle.3. Inspecter les résultats individuels
Chaque résultat dans l’export inclut l’élément source du jeu de données, les informations sur l’annotateur et le statut QA.4. Remonter à la source
Une fois que vous avez identifié l’étiquette problématique, vous pouvez rechercher l’élément original du jeu de données pour voir son fichier source, les métadonnées du capteur et l’historique complet des annotations.5. Corriger et ré-entraîner
La cause première identifiée — par exemple, une erreur d’annotation sur le piéton occulté — vous corrigez l’étiquette dans Avala, créez un nouvel export et ré-entraînez votre modèle avec les données corrigées.Avantages
Reproductibilité
Chaque export est versionné. Vous pouvez recréer l’ensemble d’entraînement exact utilisé pour n’importe quelle version de modèle en référençant l’UID de l’export. Plus de doutes sur les étiquettes incluses ou exclues.Débogage plus rapide
Au lieu de chercher manuellement parmi des milliers d’annotations pour trouver une erreur, vous tracez directement de la défaillance du modèle à l’étiquette spécifique qui l’a causée. Ce qui prenait des jours ne prend que quelques minutes.Conformité et pistes d’audit
Pour les industries réglementées (automobile, médical, défense), la traçabilité fournit la documentation que les auditeurs exigent. Chaque décision d’annotation est attribuée, horodatée et liée à sa révision QA.Amélioration continue
Suivez la qualité des annotations au fil du temps en corrélant les performances du modèle avec des annotateurs spécifiques, des étapes de révision et des versions de jeux de données. Identifiez les problèmes d’étiquetage systématiques avant qu’ils ne se propagent dans votre pipeline d’entraînement.Traçabilité via l’API
Toutes les données de traçabilité sont disponibles via la REST API et les SDKs. Endpoints clés :| Endpoint | Ce qu’il retourne |
|---|---|
GET /api/v1/exports/{uid}/ | Métadonnées d’export incluant les jeux de données, projets et horodatage de création |
GET /api/v1/tasks/ | Liste de tâches avec statut, annotateur et références aux éléments de jeu de données |
GET /api/v1/datasets/{uid}/items/ | Éléments de jeu de données avec URLs sources et appartenance aux séquences |
GET /api/v1/datasets/{uid}/sequences/ | Séquences avec nombre d’images et références aux éléments |
Prochaines étapes
Contrôle qualité
Découvrez comment les flux QA multi-étapes d’Avala détectent les erreurs d’annotation avant qu’elles n’atteignent votre modèle.
Exports
Créez des exports versionnés de vos données annotées avec des métadonnées de lignage complètes.
SLAs de qualité
Comprenez les garanties de qualité, les objectifs de précision et les délais d’exécution d’Avala.
Python SDK
Installez le SDK et commencez à interroger vos données par programmation.