Что означает прослеживаемость в Avala
Каждая аннотация в Avala несёт полные метаданные происхождения:| Сущность | Что отслеживается |
|---|---|
| Элемент набора данных | URL исходного файла, временная метка загрузки, принадлежность к последовательности, метаданные сенсора |
| Задача | Назначенный аннотатор, время создания, время завершения, переходы состояний |
| Результат | Данные аннотации, использованный инструмент, ID аннотатора, временная метка отправки |
| QA-рецензия | ID рецензента, решение рецензии (принять/отклонить/исправить), комментарии |
| Экспорт | Формат экспорта, включённые наборы данных/проекты/срезы, временная метка создания, версия |
Пошаговый пример: отладка ошибки модели
Вот конкретный пример того, как прослеживаемость помогает отлаживать проблему продакшн-модели.1. Модель ошибается на граничном случае
Ваша модель восприятия неправильно классифицирует частично перекрытого пешехода в скане LiDAR. Вы определяете предсказание и хотите понять, почему модель научилась такому поведению.2. Найдите обучающие данные
Используйте SDK для поиска в экспортах элементов набора данных, которые внесли вклад в обучающую выборку модели.3. Проверьте отдельные результаты
Каждый результат в экспорте включает исходный элемент набора данных, информацию об аннотаторе и статус QA.4. Проследите до источника
Определив проблемную метку, вы можете найти оригинальный элемент набора данных, чтобы увидеть его исходный файл, метаданные сенсора и полную историю аннотаций.5. Исправьте и переобучите
Определив первопричину — например, ошибку аннотации перекрытого пешехода — вы исправляете метку в Avala, создаёте новый экспорт и переобучаете модель на исправленных данных.Преимущества
Воспроизводимость
Каждый экспорт версионирован. Вы можете воссоздать точный обучающий набор, использованный для любой версии модели, по UID экспорта. Никаких догадок о том, какие метки были включены или исключены.Быстрая отладка
Вместо ручного перебора тысяч аннотаций в поисках ошибки вы прослеживаете путь напрямую от ошибки модели до конкретной метки, которая её вызвала. То, что раньше занимало дни, теперь занимает минуты.Соответствие и аудиторские следы
Для регулируемых отраслей (автомобилестроение, медицина, оборона) прослеживаемость обеспечивает документальный след, который требуют аудиторы. Каждое решение по аннотации атрибутировано, датировано и связано с QA-рецензией.Непрерывное улучшение
Отслеживайте качество аннотаций во времени, соотнося производительность модели с конкретными аннотаторами, этапами рецензирования и версиями наборов данных. Выявляйте систематические проблемы разметки до того, как они распространятся по вашему пайплайну обучения.Прослеживаемость через API
Все данные прослеживаемости доступны через REST API и SDK. Ключевые эндпоинты:| Эндпоинт | Что возвращает |
|---|---|
GET /api/v1/exports/{uid}/ | Метаданные экспорта, включая наборы данных, проекты и временную метку создания |
GET /api/v1/tasks/ | Список задач со статусом, аннотатором и ссылками на элементы набора данных |
GET /api/v1/datasets/{uid}/items/ | Элементы набора данных с URL источников и принадлежностью к последовательностям |
GET /api/v1/datasets/{uid}/sequences/ | Последовательности с количеством кадров и ссылками на элементы |
Следующие шаги
Контроль качества
Узнайте, как многоэтапные QA-процессы Avala отлавливают ошибки аннотации до того, как они попадут в вашу модель.
Экспорты
Создавайте версионированные экспорты аннотированных данных с полными метаданными происхождения.
Качество и SLA
Узнайте о гарантиях качества, целях точности и сроках выполнения Avala.
Python SDK
Установите SDK и начните программно запрашивать данные.