服博会现场直击!淘丁数科董事长苏斌分享大模型数据标注场景化破局路径

来源:淘丁数科

6月16日至18日,第十五届中国国际服务外包交易博览会于武汉光谷科技会展中心盛大举办,本届展会以 “数智创新,合作共赢” 为核心主题,集结海内外数字服务、服务外包标杆企业,共同探讨产业数字化、智能化转型的全新发展机遇与落地实践。淘丁数科董事长苏斌、副总裁李守仁、副总裁王欢受邀参会,苏斌总现场带来《大模型数据标注场景化破局路径》主题分享,围绕垂直场景标注如何突破大模型落地痛点,分享企业实战思路与行业前沿洞察。

服博会现场直击!淘丁数科董事长苏斌分享大模型数据标注场景化破局路径插图

苏斌指出,当前数据标注行业正面临重要的战略机遇期。国家数据局已发布专项政策,推动标注产业向规范化、高质量方向发展,预计2026年全球市场规模将达到58亿美元,中国年复合增长率超过20%。但更值得关注的是,行业范式正在发生根本性转变——从“数据为王”转向“场景为王”。数据标注不再是简单的流水线作业,而是深度融合行业知识的精细化工程,其价值如同从“原油”提炼为“高纯度燃料”,实现了质的跃升。

在这一转型过程中,大模型标注面临着三大核心挑战。

  • 首先是高知识密度需求,医疗、金融等垂直领域要求标注人员精准理解专业术语和复杂逻辑,比如病历需关联诊疗方案、合同需标注风险条款。
  • 其次是多模态融合的难题,跨图文、音视频的语义对齐要求标注者具备跨领域的理解能力。
  • 此外,是动态交互与对齐,通过交互式标注(如RLHF技术)不断校准模型输出,确保模型输出与人类价值观保持高度一致。

针对这些挑战,苏斌分享了淘丁数科的“场景化六步法”破局方案,即业务场景解构、数据策略规划、标注方案设计、人机协同执行、质量闭环反馈和价值量化交付。依托自主研发的“淘丁精标云”数据标注平台,公司采用AI预标注结合专家审核的模式,在提升效率的同时保障精度,还可以根据企业需求提供全流程私有化部署,确保数据安全。

服博会现场直击!淘丁数科董事长苏斌分享大模型数据标注场景化破局路径插图1

在垂直领域的落地实践中,淘丁数科已积累了丰富案例。医疗健康方面,通过CT影像病灶掩码标注和电子病历关联标注,有效提升AI辅助诊断的准确性;自动驾驶领域,实现毫秒级帧标注,包括车道线识别和极端天气下的目标识别,增强了感知模型的可靠性;金融科技方面,对合同风险条款和欺诈交易特征进行标注,为智能风控系统提供支撑;工业制造中,设备故障的视觉特征和质检缺陷标注,助力预测性维护模型的优化。

淘丁数科深耕AI数据服务已有11年,在全国布局了8大标注基地,拥有超过3000人的专业团队。展望未来,公司将以此次服博会为契机,持续聚焦场景化数据服务,以精细化、场景化标注解决方案助力各行业大模型规模化落地,携手产业伙伴共建数智化合作新生态。