logo

淘丁数据标注科普:语言数据标注中的7种异常

来源:淘丁集团

在语音数据标注的过程中,语音数据的有效性判定是至关重要的一步。有些是因为录制设备,有些是因为说话人的操作不规范,从而导致录制的语音出现异常现象。在数据标注过程中,需要对这些异常语音数据加以鉴别并挑选出来,保证标注数据的整洁性。

今天就一起看看常见的集中语音数据异常现象。

淘丁数据标注科普:语言数据标注中的7种异常插图

1、丢帧
在语音录制过程中,由于音频设备的问题而表现出的发音卡顿,例如,语音段中某0.1秒内突然没有声音,0.1秒过后语音又恢复正常,此现象称为“丢帧”。它常出现于整句话的句中。此时,在做有效语音判定时该句话即被判定为无效语音

2、切音
在语音录制过程中,由于过早结束或过晚开始录制而导致个别字被截断,从而表现出发音不完整,此现象称为“切音”。它常出现于整句话的句首或句尾,此时,在做有效语音判定时该句话即被判定为无效语音

3、吞音
在说话人发音时,由于个别字的声母或韵母未完全发音而表现出的发音不完整,此现象称为“吞音”。它常出现于整句话的句中,此时,在做有效语音判定时该句话即被判定为无效语音

4、喷麦
在说话人发音时,由于距离麦克风太近而表现出的录入语音不清晰,听起来有明显“噗噗”的声音,此现象称为“喷麦”。喷麦声会产生非常强大的低频能量,从而损坏人声质量并影响声音的整体效果。它常出现于整句话中含有爆破音的位置,比如含有“p”“b”辅音的单词。此时,在做有效语音判定时该句话即被判定为无效语音

5、重音
在说话人发音时,语音中出现两个或多个说话人,他们的音量大小相近且有大段重叠,无法分清主次,此现象称为“重音”。它常出现于整句话的句中,此时,在做有效语音判定时该句话即被判定为无效语音

6、空旷音
在进行语音合成等研究时,往往对语音数据质量要求极高,特别是语音的声学场景。空间决定了声学场景,声学场景由需要识别的声音和不需要识别的声音组成。在实际生活中,经常会出现非常复杂的声学场景,空旷音是其中的一种

在录制过程中,由于周围环境较为空旷而表现出来的发音中带有回音,此现象称为“空旷音”。空旷音多发生在大会议或空中的房间里,回声会比较严重。它常出现于整句话的句中,此时,在做有效语音判定时该句话会被判定为无效语音

7、混响
混响是一种常见的声学场景。与回声不同,混响是音源发出的原始语音(也称干声)经多次反射、折射后叠加而成的混合声音,在实际生活中,任何环境都会产生混响。在音乐厅或练歌房内,房间构造产生的混响效果会让音乐和歌声听起来更悦耳。而对语音识别、语音合成等语音研究来说,语音的清晰度则里为重要,因此,在做有效语音判定时含有明显混响的语音段被判定为无效语音。

淘丁数据标注科普:语言数据标注中的7种异常插图1

淘丁内容安全业务自2018年4月开始,服务于互联网平台线上产品安全审核工作,对各类违法、色情、涉政等不良违禁信息实行7*24小时即时审核,对有害信息进行人工甄别,确保产品绝对安全。

淘丁数据标注科普:语言数据标注中的7种异常插图2

淘丁数据标注团队现有人员规模超千人,业务分部全国重点城市。淘丁与国内大型企业深入合作,日常处理项目量级均为百万级以上,部分数据量级超过千万,拥有稳定充足的业务来源。各类标注项目经验丰富,可为人员提供标准化、体系化的培训。

淘丁数据标注科普:语言数据标注中的7种异常插图3

淘丁集团专注于互联网内容安全和数据标注业务领域,拥有千人专业团队,经验丰富,准确率高,服务类别多,团队体系成熟,能快速响应大量业务需求。欢迎咨询联系4000298686。