Спринт сбора визуальных данных ИИ для генеративной модели зрения
Задачи:
Клиенту требовались разнообразные наборы визуальных данных для обучения генеративной модели зрения, но существующие источники не отличались демографическим балансом. Недопредставленность незападных групп приводила к необъективным результатам и снижению реалистичности. Этот недостаток данных препятствовал справедливости, точности и глобальной масштабируемости модели.
Промышленность:
Искусственный интеллект / Компьютерное зрение / Аннотирование данных
Решения:
SummitNext осуществил скоординированный во всем мире сбор данных, задействовав проверенных участников, локальный набор и двухуровневый контроль качества для соблюдения демографических и технических стандартов.
Результаты:
Достигнуто соответствие требованиям клиента 96%, собрано 30 000+ высококачественных визуальных материалов от 5000 участников и обеспечено сбалансированное демографическое представительство по пяти основным странам, что позволило модели искусственного интеллекта клиента работать более точно и этично.
О клиенте
Клиент - ведущая мировая компания в области искусственного интеллекта, специализирующаяся на генеративных моделях зрения. В связи с растущей обеспокоенностью по поводу предвзятости и инклюзивности наборов данных компания стремилась расширить разнообразие своих обучающих данных путем получения сбалансированных изображений лиц недопредставленных демографических групп из разных регионов.
Однако пробелы в представленности таких стран, как Индия, США, Канада, Китай и Пакистан, ограничивали справедливость и обобщающую способность модели.
Обзор кейса
SummitNext Technologies, малазийская компания, предоставляющая услуги BPO и данные, сотрудничала с клиентом, чтобы реализовать шестимесячный масштабный проект по сбору изображений. Инициатива была направлена на сбор демографически разнообразных изображений при соблюдении строгих технических и этических стандартов. SummitNext сочетала оперативный подбор персонала, управление базами данных и проверку качества, чтобы предоставить набор данных, соответствующий мировым стандартам, который повысил справедливость и надежность генеративной модели искусственного интеллекта клиента.
Вызовы
Неравномерное демографическое представительство в глобальных обучающих базах данных ИИ.
Сложная логистика сбора данных в Индии, Китае, Пакистане, Канаде и США.
Строгие требования к качеству и соответствию требованиям, включающие более 70 критериев.
Невозможность участия в исследовании из-за соображений конфиденциальности и этики.
Решение:
SummitNext реализовал трехфазную модель для получения разнообразных и высококачественных наборов данных благодаря оперативному поиску источников и строгому контролю качества.
- Активация фрилансеров - SummitNext мобилизовал свой внутренний пул предварительно проверенных участников через надежные цифровые каналы, такие как Telegram и WhatsApp, обеспечив быстрое включение и разнообразный поиск участников в пяти странах.
- Курирование базы данных и управление коллекцией - Все изображения надежно хранились в централизованной базе данных, распределенные по полу, региону и цвету кожи. Контроль квот в режиме реального времени и аннотирование метаданных обеспечили сбалансированное представление и точность.
- Контроль качества, ориентированный на человека - двухуровневый процесс проверки человеком каждого изображения на предмет технической точности и демографической достоверности. Проект достиг 85% первого прохода и 96% соответствия, обеспечив высококачественный набор данных в соответствии со стандартами клиента.
Хотите узнать полную историю нашего клиента?
КТО МЫ
SummitNext Technologies, основанная в 2020 году, - это BPO-компания, цель которой - преобразовать сферы поддержки клиентов, привлечения клиентов, аннотирования данных и бэкенд-поддержки с помощью технологий, человеческого опыта и инноваций. Наш головной офис находится в Малайзии, а офисы - на Филиппинах. Индии и Узбекистане. Мы оказываем поддержку
сотрудничает с удаленными командами в более чем 28 странах.