淘丁集团董事长苏斌受邀参加医疗健康数据集建设研讨会,分享数据标注实践经验
3月31日,“医疗健康高质量数据集建设研讨会”在河北保定成功举行。此次研讨会由保定高新区管委会、保定市数据局、保定市卫生健康委员会、河北省医院管理学会联合主办,保定高新区科技创新局与中国信通院河北科技创新研究院(简称“中国信通院河北研究院”)共同承办。会议聚焦医疗健康高质量数据集的建设路径,展开了深入研讨。
淘丁集团董事长苏斌受邀出席了此次会议。与会者来自河北省医院管理学会、保定高新区、保定市数据局、中国人工智能产业发展联盟等多个相关单位,以及企事业单位、知名专家学者和企业代表,近60人齐聚一堂,共绘技术与产业融合创新的发展蓝图,探索人工智能产业新生态格局路径,以加速推动医疗健康数据集产业的蓬勃发展。

在此次医疗健康高质量数据集研讨会上,淘丁集团董事长苏斌发表了精彩分享。他详细介绍了淘丁集团在医疗数据标注领域的探索与实践,以及如何通过技术创新和专业化服务,为医疗AI的高质量发展助力。以下是苏斌董事长的分享内容:

各位嘉宾、同仁们:
大家好!我是淘丁集团董事长苏斌,非常荣幸能在此次医疗健康高质量数据集研讨会上发言。今天,我想与大家分享淘丁集团在医疗数据标注领域的探索与实践,以及我们如何通过技术创新和专业化服务,助力医疗AI的高质量发展。我从以下四个方面做一下介绍:
一、淘丁的核心业务与定位
作为一家以大数据和人工智能技术驱动的企业,淘丁集团始终聚焦于数据价值挖掘与智能化应用。我们构建了覆盖数据标注、大模型训练、内容风控等多领域的服务体系,尤其在医疗数据标注领域,我们以“精准、高效、安全”为核心,为医疗AI模型的研发提供坚实的数据基石。
二、淘丁医疗数据标注的三大优势
1、全链路自研技术平台
我们自主研发的“淘丁精标云”平台,实现了从数据清洗、AI预标注到人工复核标注的全流程自动化。平台支持文本、图像、视频、3D影像等多模态数据标注,尤其在3D医疗影像处理上,能精准标注骨骼、心脏等复杂结构,与2D工具协同满足多样化需求。例如,在某大型互联网公司的医疗大模型多模态标注项目中,我们通过该平台完成了百万级医疗图片及疾病诊断过程的精准标注。
2、专业化医疗标注团队
我们拥有200名全职本科、硕士、博士医学背景标注专家和1000名兼职众包医生团队,成员均通过严格医学术语考核,并与西安交大医学院、西北大学医学院、重庆医科大等8所医学院校建立深度合作,持续培养壮大医学标注专家队伍,这种“产学研”结合模式,确保了标注结果的专业性和准确性,如电子病历中的疾病分型诊疗思路、手术视频中的关键操作节点等复杂场景,均能高质量完成。
3、严苛的质量控制体系
我们采用“AI预标注+人工复核+专家终审”三级质控机制,结合加密存储、权限管理等技术,确保数据安全合规。以手术视频数据标注为例,我们的错误率控制在0.13%以内,远超客户要求的准确率。
三、实践成果与行业贡献
目前,我们已服务多家医院和互联网、AI医疗科技企业,累计标注医疗数据超500TB,涵盖影像、手术视频、文本、图片、基因五大类。在罕见病诊断、辅助诊疗、在线问诊、手术规划、药物研发等领域,我们的数据支撑了多个国家级科研项目,助力AI医疗从实验室走向临床应用。今年3月,我们荣获“数据资产服务一级企业”认证,成为国内少数具备规模化医疗数据训练能力的企业。
未来,淘丁将持续投入研发,打造“数据采集+AI标注+专家复核”三位一体的综合服务平台。我们计划推出更多针对医疗场景的智能标注工具,并深化与医疗机构、高校的合作,共同推动医疗数据标注的标准化和智能化,为全球医疗AI发展贡献中国智慧。
最后,我想说:高质量医疗数据标注是AI医疗的基石,而专业团队与技术创新才是这座基石的根基。淘丁愿与各位携手,共筑医疗AI的明天!谢谢大家!