Разметка данных
Разметка данных (англ. data annotation) — это процесс пометки или присвоения релевантных метаданных элементам набора данных с целью позволить вычислительным системам точно интерпретировать информацию. Такие наборы данных могут быть представлены в виде изображений, аудиофайлов, видеозаписей или текстов.
Применение
Данные являются основополагающим компонентом при разработке искусственного интеллекта (ИИ). Обучение моделей ИИ, особенно в области компьютерного зрения и обработки естественного языка, требует больших объёмов размеченных данных[1]. Грамотная разметка обеспечивает способность алгоритмов машинного обучения распознавать закономерности и делать точные предсказания[2]. К распространённым видам разметки относят классификацию, выделение ограничивающих рамок, семантическую сегментацию и разметку ключевых точек[3].
Разметка данных применяется в ИИ-ориентированных сферах, таких как здравоохранение, автономный транспорт, ритейл, безопасность и развлечения. Точная разметка позволяет моделям машинного обучения выполнять сложные задачи, например выявление объектов, анализ тональности и распознавание речи, с высокой степенью точности[4].[5]
Разметка данных в компьютерном зрении
Классификация изображений, также называемая категоризацией, заключается в присвоении изображениям заранее определённых меток. Алгоритмы машинного обучения, обученные на классифицированных изображениях, могут впоследствии распознавать объекты и различать категории. Например, модель ИИ, обученная распознавать стили мебели, способна отличать кресла в стиле Георга и Рококо[6].
Семантическая сегментация подразумевает присвоение каждому пикселю на изображении определённого класса, например «деревья», «транспорт», «люди» или «здания». Такая разметка позволяет моделям машинного обучения выделять объекты по группам схожих пикселей, обеспечивая детальное понимание содержимого изображения[7].[8]
Разметка ограничивающими рамками заключается в выделении на изображении объектов с помощью прямоугольников. Этот метод широко используется в автономном вождении, видеонаблюдении и аналитике розничных продаж для обнаружения и классификации объектов, таких как пешеходы, транспортные средства и товары на полках магазинов[9].
Разметка 3D-кубоидами расширяет традиционную разметку прямоугольниками за счёт добавления информации о глубине, что позволяет моделям предсказывать пространственную ориентацию, движение и размер объектов. Такой подход особенно востребован в робототехнике и автономных транспортных средствах, где важно учитывать размеры и глубину объектов[10].[11]
Для объектов со сложной, изогнутой или многоугольной формой полигональная разметка обеспечивает более точное выделение, чем ограничивающие рамки. Такой метод часто используется в задачах, требующих детального распознавания объектов, например в медицинской визуализации или аэросъёмке[11].
Разметка ключевых точек позволяет отмечать на объекте определённые ориентиры — например, черты лица или суставы — что используется для отслеживания, анализа движения и поз. Этот метод широко применяется для распознавания лиц, детектирования эмоций, спортивной аналитики и приложений дополненной реальности[12].


