Was ist eine Ontologie?
Im Kontext der Datenannotation ist eine Ontologie (oder Label-Taxonomie) das vollständige Schema von Klassen, Attributen und Beziehungen, das Annotatoren zum Labeln von Daten verwenden. Sie definiert:- Was für Objekte zu labeln sind (Objektklassen)
- Wie sie beschrieben werden (Attribute und Eigenschaften)
- Wie Klassen zueinander in Beziehung stehen (Hierarchie und Gruppierung)
Objektklassen
Objektklassen sind die Kernbausteine Ihrer Taxonomie. Jede Klasse repräsentiert eine Kategorie von Objekten, die Annotatoren in den Daten identifizieren und labeln werden.Klassen definieren
Beim Erstellen eines Projekts in Avala definieren Sie Ihre Label-Konfiguration als Liste von Klassen:Best Practices für Klassennamen
| Praxis | Beispiel | Warum |
|---|---|---|
| Verwenden Sie kleingeschriebene, spezifische Namen | sedan, pickup_truck | Reduziert Mehrdeutigkeit |
| Vermeiden Sie überlappende Definitionen | Verwenden Sie nicht sowohl car als auch vehicle auf derselben Ebene | Verhindert Annotator-Verwirrung |
| Seien Sie konsistent mit Trennzeichen | traffic_light nicht traffic-light oder trafficLight | Konsistentes Parsing in Trainingspipelines |
| Negative/Hintergrundklassen nur bei Bedarf | unknown, ignore_region | Manche Modelle erfordern explizite Hintergrund-Labels |
Attribute
Attribute fügen jeder Annotation strukturierte Metadaten über die Objektklasse hinaus hinzu. Sie ermöglichen Annotatoren, Eigenschaften wie Sichtbarkeit, Pose oder Zustand zu beschreiben.Attributtypen
Avala unterstützt mehrere Attributtypen, die Sie an jede Objektklasse anhängen können:| Typ | Beschreibung | Wann verwenden | Beispiel |
|---|---|---|---|
| Dropdown | Einzelauswahl aus einer vordefinierten Liste | Sich gegenseitig ausschließende Optionen | Verdeckung: none, partial, heavy |
| Checkbox | Boolescher Schalter | Einfache Ja/Nein-Flags | is_parked: true/false |
| Text | Freitexteingabe | Eindeutige Bezeichner oder Beschreibungen | Kennzeichen |
| Zahl | Numerischer Wert | Messungen oder Zählungen | Geschätzte Entfernung in Metern |
| Mehrfachauswahl | Mehrere Auswahlmöglichkeiten aus einer Liste | Gleichzeitige, nicht-exklusive Zustände | Sichtbar: headlights, taillights, turn_signal |
Attribute konfigurieren
Attribute werden in der Klassifikationskonfiguration des Projekts zusammen mit der Label-Konfiguration definiert:Bedingte Attribute
Verwenden Sie das Feldapplies_to, um Attribute nur für relevante Klassen anzuzeigen. Dies hält die Benutzeroberfläche des Annotators sauber — ein pedestrian benötigt kein is_parked-Attribut, und eine traffic_light benötigt kein truncation.
Hierarchische Taxonomien
Für komplexe Domänen werden flache Klassenlisten unhandlich. Hierarchische Taxonomien gruppieren verwandte Klassen unter Oberkategorien.Beispiel: Fahrzeugtaxonomie
Wann Hierarchien verwenden
| Szenario | Empfehlung |
|---|---|
| Weniger als 15 Klassen | Flache Liste ist einfacher und schneller |
| 15-50 Klassen | In 3-5 Oberkategorien gruppieren |
| 50+ Klassen | Mehrstufige Hierarchie mit Suche verwenden |
| Klassen teilen Attribute | Unter Elternklasse gruppieren, damit Attribute vererbt werden |
Hierarchien entwerfen
- Beginnen Sie breit, dann verfeinern Sie. Starten Sie mit Oberkategorien (
vehicle,pedestrian,infrastructure) und fügen Sie Spezifität nur hinzu, wo Ihr Modell sie benötigt. - Jede Blattklasse sollte eindeutig sein. Wenn Annotatoren nicht zuverlässig zwischen zwei Unterklassen unterscheiden können, führen Sie sie zusammen.
- Tiefe und Breite ausbalancieren. Tiefe Hierarchien (4+ Ebenen) verlangsamen Annotatoren. Bevorzugen Sie breitere Bäume mit 2-3 Ebenen.
Einzellabel- vs. Mehrlabel-Klassifikation
Avala unterstützt beide Klassifikationsmodi je nach Ihren Projektanforderungen.Einzellabel
Jedes Objekt oder jede Szene erhält genau ein Klassenlabel. Dies ist der Standard für die meisten Annotationstypen.- Objekterkennung: Jede Bounding Box erhält eine Klasse
- Szenenklassifikation: Jedes Bild erhält eine Kategorie
Mehrlabel
Ein Objekt oder eine Szene kann gleichzeitig mehrere Labels erhalten. Verwenden Sie dies, wenn Kategorien sich nicht gegenseitig ausschließen.- Ein Bild kann sowohl
rainyals auchnighttimesein - Ein Fahrzeug kann sowohl
damagedals auchparkedsein
Checkliste für das Ontologie-Design
Bevor Sie Ihr Annotationsprojekt starten, überprüfen Sie Ihre Ontologie anhand dieser Checkliste:| Prüfung | Frage |
|---|---|
| Vollständigkeit | Hat jedes Objekt, das Ihr Modell erkennen muss, eine Klasse? |
| Gegenseitige Exklusivität | Kann ein Annotator immer genau eine Klasse ohne Mehrdeutigkeit zuweisen? |
| Attributabdeckung | Sind alle für das Training benötigten Eigenschaften als Attribute erfasst? |
| Konsistente Granularität | Sind Klassen auf derselben Ebene gleich spezifisch? |
| Klarheit für Annotatoren | Kann ein neuer Annotator jede Klasse allein anhand ihres Namens verstehen? |
| Modellabstimmung | Entspricht die Taxonomie dem, was Ihre Modellarchitektur erwartet? |
| Skalierbarkeit | Können Sie später neue Klassen hinzufügen, ohne umzustrukturieren? |
Häufige Fehler
Überdetaillierte Klassen
Zu viele feingranulare Klassen führen zu niedrigem Inter-Annotator-Agreement und spärlichen Trainingsdaten pro Klasse. Problem: 50 Fahrzeug-Unterklassen, von denen die meisten weniger als 100 Beispiele haben. Lösung: Beginnen Sie mit 5-10 breiten Klassen. Fügen Sie Unterklassen nur hinzu, wenn Sie genügend Daten haben und Ihr Modell von der Unterscheidung profitiert.Mehrdeutige Grenzen
Wenn zwei Klassen sich konzeptionell überschneiden, werden Annotatoren sich uneinig sein, welche zu verwenden ist. Problem: Sowohlvan als auch minivan existieren, aber Annotatoren können sie nicht zuverlässig unterscheiden.
Lösung: Entweder zu einer einzelnen Klasse zusammenführen oder explizite visuelle Richtlinien mit Referenzbildern bereitstellen, die die Grenze aufzeigen.
Fehlende Sonderfälle
Reale Daten enthalten Objekte, die nicht sauber in Ihre Taxonomie passen. Problem: Ein Annotator trifft auf einen Golfwagen, aber die Taxonomie hat nurcar, truck und motorcycle.
Lösung: Fügen Sie eine Sammelklasse wie other_vehicle hinzu und überprüfen Sie regelmäßig die damit gelabelten Elemente, um Klassen zu identifizieren, die Sie hinzufügen müssen.
Nächste Schritte
Grundkonzepte
Die grundlegenden Bausteine der Avala Plattform überprüfen.
Qualitätskontrolle
Prüf-Workflows einrichten, um die Annotationsqualität zu validieren.
Annotationstypen
JSON-Formate für Bounding Boxes, Polygone, Quader und mehr ansehen.
Erster Datensatz
Daten hochladen und Ihr erstes Annotationsprojekt erstellen.