LabelSpark – это мощный инструмент от Labelbox, который соединяет Databricks с аннотирующей платформой Labelbox. Он позволяет командам программно интегрировать неструктурированные данные (изображения, текст, видео) в Labelbox, настраивать онтологии для аннотирования в Databricks и извлекать готовые аннотированные результаты в виде Spark DataFrames для рабочих процессов машинного обучения. Это решение ускоряет подготовку данных, включая функции аннотирования с помощью моделей и активного обучения, что значительно снижает необходимость в ручном труде и повышает качество меток. При этом обеспечивается высокий уровень безопасности для предприятий и масштабируемые конвейеры, что позволяет командам по разработке ИИ быстрее создавать аудируемые обучающие наборы данных, готовые к использованию.