logo

科普篇 | 八种常见的数据标注方法

来源:淘丁集团

数据标注(Data Annotations)是指对收集到的、未处理的原始数据或初级数据,包括语音、图片、文本、视频等类型的数据进行加工处理,并转换为机器可识别信息的过程。我们日常工作中常见的数据标注方法有以下几种:

01.矩形框标注

矩形框标注是一种对目标对象进行目标检测框标注的简单处理方式,常用于标注自动驾驶下的人、车、物等。

科普篇 | 八种常见的数据标注方法插图

02.多边形标注

多边形标注是指在静态图片中,使用多边形框,标注出不规则的目标物体,相对于矩形框标注,多边形标注能够更精准地框定目标,同时对于不规则物体,也更具针对性。

科普篇 | 八种常见的数据标注方法插图1

03.语义分割

语义分割是指根据物体的属性,对复杂不规则图片进行进行区域划分,并标注对应上属性,以帮助训练图像识别模型,常应用于自动驾驶、人机交互、虚拟现实等领域。

科普篇 | 八种常见的数据标注方法插图2

04.关键点标注

关键点标注模板最大的应用即是对脸部的关键点进行标注,通过不同方位的关键点标注,可以判断图像上的人物的功能。

科普篇 | 八种常见的数据标注方法插图3

05.3D点云标注

3D点云标注是指利用激光雷达采集的数据进行框选标注,供计算机视觉与无人驾驶等人工智能模型训练使用。

科普篇 | 八种常见的数据标注方法插图4

06.3D立方体标注

与点云标注不同,3D立方体标注还是基于二维平面图像的标注,标注员通过对立体物体的边缘框定,进而获得灭点,测量出物体之间的相对距离。

科普篇 | 八种常见的数据标注方法插图5

07.目标追踪

目标追踪是指在动态的图像中,进行抽帧标注,在每一帧图片中将目标物体标注出来,进而描述它们的运动轨迹,这类标注常应用于训练自动驾驶模型以及视频识别模型。

科普篇 | 八种常见的数据标注方法插图6

08.属性判别

属性判别是指通过人工或机器配合的方式,识别出图像中的目标物体,并将其标注上对应属性。

科普篇 | 八种常见的数据标注方法插图7

淘丁内容安全业务自2018年4月开始,服务于互联网平台线上产品安全审核工作,对各类违法、色情、涉政等不良违禁信息实行7*24小时即时审核,对有害信息进行人工甄别,确保产品绝对安全。

科普篇 | 八种常见的数据标注方法插图8

淘丁数据标注团队现有人员规模近500人,业务分部在西安、宝鸡、渭南、临汾、太原等地。淘丁与国内大型企业深入合作,日常处理项目量级均为百万级以上,部分数据量级超过千万,拥有稳定充足的业务来源。各类标注项目经验丰富,可为人员提供标准化、体系化的培训。

科普篇 | 八种常见的数据标注方法插图9

淘丁集团专注于互联网内容安全和数据标注业务领域,拥有千人专业团队,经验丰富,准确率高,服务类别多,团队体系成熟,能快速响应大量业务需求。

欢迎互联网公司、人工智能机构对接洽谈合作,咨询热线:029-85799062。