logo

超全详解图像、视频、文本、语音等不同数据类型

来源:淘丁集团

小编发现很多新人开始慢慢的进入到这个行业,大多数情况下,很多小伙伴问的第一句就是数据标注是什么,关于数据标注的概念我们说过太多了,今天从标注类型来了解一下关于数据标注是什么,要做些什么的疑问。

图像标注

01 线标注

根据需求标注检测对象相对应的线型位置,例如:车道线

超全详解图像、视频、文本、语音等不同数据类型插图

02  边框标注

标注检测对象相对应的区域,例如:汽车/行人等各种物体

超全详解图像、视频、文本、语音等不同数据类型插图1

03  3D边框标注

将图像中待检测物体以立体形式标注,例如汽车检测

04 语义分割

根据检测区域不同,将图像标注为不同的像素,例如来自汽车拍摄的图像

05  多边形标注

根据需求标注检测对象的形状,例如:标注图像中的汽车轮廓(示例图)或标记污损边界

06  点标注

根据需求标注检测对象参考点的像素坐标,或者图像中的关键点标记,如人脸

07   3D点云标注

在3D空间中,标注点云数据中指定的检测对象,如汽车、行车道等

点云数据标注

01   点云目标检测

3D点云目标检测用来获取物体在三维空间中的位置和类别信息,主要基于点云、双目、单目和多模态数据等方式。其中,点云数据由于拥有比较丰富的几何信息,比其它单模态数据要更加稳定。

超全详解图像、视频、文本、语音等不同数据类型插图2

02  2D/3D融合

对2D平面图与3D点云图映射的数据组进行标注,支持自动贴边、跨帧复制、测距、2/3D图片标注分离等多种功能。

03  点云语义分割

3D点云语义分割被用于自动驾驶、机器人等许多领域中,目前,已经成为场景理解的关键。

04   点云关键点

3D点云关键点可以通过定义检测标准来获取具有稳定性,区别性的点集,从技术上来说,3D点云关键点的数量比原始点云数据量少很多,而关键点技术也已成为在3D信息处理中非常关键的技术。

文本标注

01  实体命名

标注文本中的实体

02 OCR转写

将图像中的文字进行识别,并以文本的形式转写

03 词性标注

基于特定文本数据进行词性理解标注,如动词、名词、形容词等

04 文本信息抽取

把文本里包含的信息进行分类和打标签等结构化处理

05 指代消解

基于特定文本数据进行指代词的统一,将上下文中用来表述同样目标的名词和代词标注统一

06  槽位填充

对于给定的句子中的每个词分别打上相应的标签,进行序列标注

视频标注

01 视频跟踪

在视频或者连续的图像中跟踪标注检测对象,形成有ID关联的运动轨迹

02  视频打点

鼠标移到视频播放条上的白色小点,则显示出在该点上所播放的内容。通过系统能把视频的关键内容点标记出来,以便用户快速浏览到其想看的内容

03  视频分类

通过观看视频片段对视频按主题进行分类,助力建立视频资料库,常用于视频行业的图像识别模型训练,可应用于智慧文娱场景的落地

语音标注

01  语音转写

根据音频播放的内容转写为对应的文本,常用于语音识别模型训练,可支持普通话、方言、英文和小语种的语音转写,应用于智能家居、智能设备、智能客服、智慧门店等场景落地

02  音素打点

音素标注就是根据音标、组成音素和读音对语音进行标注,常用于语音合成技术

03 韵律标注

系统中的韵律标注一般采用基于文本信息预测韵律的方式。以中文标注为例,基于文本信息进行韵律预测,通常根据声母、韵母、词、短语、段落等信息确定的韵律预测结果。由专业的标注人员根据韵律预测结果完成韵律标注

04 语音切分

语音切分是对长音频进行监听,标注音频中说话人的起始点,用于语音识别模型训练,应用于智能家居、智能设备、智能客服、智慧门店等场景落地

05  语音情绪判断

同样一条语音内容,用不同的情绪说出来,其所带有的语义可能是完全不同的,只有计算机同时识别出语音的内容以及语音所带有的情绪,我们才能准确的理解出语言的语义,因此理解语音的情绪能让人机交互变得更有意义。

无论全职、兼职,数据标注人员的从业人数之所以屡创新高,主要归因于人工智能的指数级增长,以及越来越多样化数据标注场景。

应用场景包括:交通、金融行业、医疗行业、家居行业、安防行业、公共服务、电子商务、农业、工业等等,我们生活所能接触的方方面面智能化都离不开人工智能。