生成視覺模型的 AI 視覺資料收集衝刺
挑戰:
客戶需要多樣化的視覺資料集來訓練一個產生式視覺模型,但現有的資料來源缺乏人口平衡。非西方群體的代表性不足,導致輸出結果有偏差,真實度降低。這個資料缺口妨礙了公平性、準確性和全球模型的可擴展性。.
產業:
人工智慧 / 電腦視覺 / 資料註解
解決方案:
SummitNext 執行全球協調的資料收集衝刺,利用經核實的貢獻者、當地化招募和雙層品質控制,以符合人口和技術標準。.
結果:
達成 96% 符合客戶要求,從 5,000 位貢獻者收集了 30,000+ 張高品質視覺照片,並確保五個主要國家的人口代表性均衡 - 使客戶的 AI 模型能夠更準確、更符合道德標準地執行。.
關於客戶
客戶是一家全球領先的人工智能公司,專門從事生成視覺模型。由於資料集的偏見和包容性日益受到關注,該公司希望透過從多個地區代表性不足的人口群組中擷取平衡的臉部影像,以加強訓練資料的多樣性。.
然而,印度、美國、加拿大、中國和巴基斯坦等國家在代表性方面的差距限制了模型的公平性和概括能力。.
案例總覽
SummitNext Technologies 是馬來西亞的 BPO 和資料服務公司,與客戶合作執行為期六個月的大型圖像收集專案。這項計畫的重點是在維護嚴格的技術和道德標準的同時,收集不同人口的視覺資料。SummitNext 結合敏捷招募、資料庫管理和品質驗證,提供符合全球標準的資料集,強化客戶生成式 AI 模型的公平性和可靠性。.
挑戰
全球 AI 訓練資料集中不平均的人口代表性。.
跨印度、中國、巴基斯坦、加拿大和美國的複雜資料收集物流。.
嚴格的品質與合規要求,超過 70 項標準。.
貢獻者因隱私和道德問題而猶豫不決。.
解決方案:
SummitNext 採用三階段模式,透過敏捷的採購和嚴格的品質控制,提供多樣化、高品質的資料集。.
- 自由撰稿人啟動 - SummitNext透過Telegram和WhatsApp等可信賴的數位管道,動員內部預先審核的撰稿人,確保快速入職,並在五個國家尋找不同的參與者。.
- 資料庫整理與收藏管理 - 所有影像都安全地儲存在中央資料庫中,並依性別、區域與膚色分類。即時配額監控和元資料註釋確保了均衡的代表性和準確性。.
- 以人為本的品質控制 - 雙層人工審核程序驗證每張影像的技術精確度與人口統計準確度。本專案達到 85% 第一次通過驗收,並符合 96% 標準,提供符合客戶標準的高品質資料集。.
想要探索我們客戶的完整故事嗎?
我們是誰
SummitNext Technologies 創立於 2020 年,是一家 BPO 公司,其願景是透過技術、人員專業知識和創新來改變客戶支援、客戶獲取、資料註釋和後端支援領域。我們的總部設在馬來西亞,並在菲律賓、印度和烏茲別克斯坦設有辦事處。印度和烏茲別克斯坦。我們提供
在超過 28 個以上的國家與遠端團隊合作。.