超全详解图像、视频、文本、语音等不同数据类型

发稿时间：2023-01-09来源：淘丁数科

小编发现很多新人开始慢慢的进入到这个行业，大多数情况下，很多小伙伴问的第一句就是数据标注是什么，关于数据标注的概念我们说过太多了，今天从标注类型来了解一下关于数据标注是什么，要做些什么的疑问。

一、图像标注

01 线标注

根据需求标注检测对象相对应的线型位置，例如：车道线

02 边框标注

标注检测对象相对应的区域，例如：汽车/行人等各种物体

03 3D边框标注

将图像中待检测物体以立体形式标注，例如汽车检测

04 语义分割

根据检测区域不同，将图像标注为不同的像素，例如来自汽车拍摄的图像

05 多边形标注

根据需求标注检测对象的形状，例如：标注图像中的汽车轮廓(示例图)或标记污损边界

06 点标注

根据需求标注检测对象参考点的像素坐标，或者图像中的关键点标记，如人脸

07 3D点云标注

在3D空间中，标注点云数据中指定的检测对象，如汽车、行车道等

二、点云数据标注

01 点云目标检测

3D点云目标检测用来获取物体在三维空间中的位置和类别信息，主要基于点云、双目、单目和多模态数据等方式。其中，点云数据由于拥有比较丰富的几何信息，比其它单模态数据要更加稳定。

02 2D/3D融合

对2D平面图与3D点云图映射的数据组进行标注，支持自动贴边、跨帧复制、测距、2/3D图片标注分离等多种功能。

03 点云语义分割

3D点云语义分割被用于自动驾驶、机器人等许多领域中，目前，已经成为场景理解的关键。

04 点云关键点

3D点云关键点可以通过定义检测标准来获取具有稳定性，区别性的点集，从技术上来说，3D点云关键点的数量比原始点云数据量少很多，而关键点技术也已成为在3D信息处理中非常关键的技术。

三、文本标注

01 实体命名

标注文本中的实体

02 OCR转写

将图像中的文字进行识别，并以文本的形式转写

03 词性标注

基于特定文本数据进行词性理解标注，如动词、名词、形容词等

04 文本信息抽取

把文本里包含的信息进行分类和打标签等结构化处理

05 指代消解

基于特定文本数据进行指代词的统一，将上下文中用来表述同样目标的名词和代词标注统一

06 槽位填充

对于给定的句子中的每个词分别打上相应的标签，进行序列标注

三、视频标注

01 视频跟踪

在视频或者连续的图像中跟踪标注检测对象，形成有ID关联的运动轨迹

02 视频打点

鼠标移到视频播放条上的白色小点，则显示出在该点上所播放的内容。通过系统能把视频的关键内容点标记出来，以便用户快速浏览到其想看的内容

03 视频分类

通过观看视频片段对视频按主题进行分类，助力建立视频资料库，常用于视频行业的图像识别模型训练，可应用于智慧文娱场景的落地

四、语音标注

01 语音转写

根据音频播放的内容转写为对应的文本，常用于语音识别模型训练，可支持普通话、方言、英文和小语种的语音转写，应用于智能家居、智能设备、智能客服、智慧门店等场景落地

02 音素打点

音素标注就是根据音标、组成音素和读音对语音进行标注，常用于语音合成技术

03 韵律标注

系统中的韵律标注一般采用基于文本信息预测韵律的方式。以中文标注为例，基于文本信息进行韵律预测，通常根据声母、韵母、词、短语、段落等信息确定的韵律预测结果。由专业的标注人员根据韵律预测结果完成韵律标注

04 语音切分

语音切分是对长音频进行监听，标注音频中说话人的起始点，用于语音识别模型训练，应用于智能家居、智能设备、智能客服、智慧门店等场景落地

05 语音情绪判断

同样一条语音内容，用不同的情绪说出来，其所带有的语义可能是完全不同的，只有计算机同时识别出语音的内容以及语音所带有的情绪，我们才能准确的理解出语言的语义，因此理解语音的情绪能让人机交互变得更有意义。

无论全职、兼职，数据标注人员的从业人数之所以屡创新高，主要归因于人工智能的指数级增长，以及越来越多样化数据标注场景。

应用场景包括：交通、金融行业、医疗行业、家居行业、安防行业、公共服务、电子商务、农业、工业等等，我们生活所能接触的方方面面智能化都离不开人工智能。

下一篇
淘丁集团 | 数据标注过程中如何保护用户数据安全？ »