logo

淘丁数据标注:AI语音数据标注识别市场怎么样?

来源:淘丁集团

语音语义识别是指通过语音信号处理和语义识别,使得计算机自动理解人类口述语言的技术。语音识别主要步骤为信号搜集、降噪、特征提取解码三步,提取的特征在后台由经过语音大数据训练得到的语音模型对其进行解码,最终把语音转化为文本。语义识别则通过自然语言分析,理解人类语言表达的意思。

AI语音识别市场

1 市场规模

语音语义识别是指通过语音信号处理和语义识别,使得计算机自动理解人类口述语言的技术。语音识别主要步骤为信号搜集、降噪、特征提取解码三步,提取的特征在后台由经过语音大数据训练得到的语音模型对其进行解码,最终把语音转化为文本。语义识别则通过自然语言分析,理解人类语言表达的意思。

根据Research and Markets研究预测,全球智能语音市场将持续快速增长,到2020年市场规模将达到191.7亿美元。目前阶段,语音识别应用市场主要为智能音箱、智能语音交互家电等领域,可以预见,智能语音识别还将在自动驾驶、教育、医疗等领域得到深度应用。语音语义识别的终极发展目标为多语言自动翻译技术及设备,一旦该最终目标成为现实,将有可能彻底打破不同语言之间的交流障碍,重现“巴比伦之塔”,对人类社会产生极其深远的影响。

1、智能音箱市场

智能音箱领域正在迎来爆发式增长。目前,包括亚马逊、谷歌、阿里、小米、百度、京东、华为在内的全球互联网、手机巨头陆续进入智能音箱领域, 并将其提升到战略产品的高度。一方面,智能音箱作为智能家居的入口,有望带动其他硬件产品快速增长;另一方面,通过智能音箱作为家庭数据入口,各巨头有望在未来拓展其它商业模式。

2、智能语音交互家电市场

除了迅速增长的智能音箱领域,各大家电厂商也都在积极集成语音交互功能。语音交互既能为产品增加一个新颖独特的功能,也能成为家庭语音入口并持续积累用户行为信息。

1)智能电视市场

随着以小米电视为代表的智能电视逐步普及,看电视的方式在过去三年间发生了巨大的变化,年轻一代的电视观众迅速完成了从被动收看直播到主动点播甚至搜索内容的模式转变。语音交互为智能电视的内容搜索功能带来了极大的便利,将有力地带动高质量付费内容的收入增长。目前,创维、小米、暴风、海尔等均已推出智能语音识别电视。

2017年,中国智能电视销量达4736.5万台,同比增长13.8%,2018年智能电视销量将突破5000万台。预计语音交互将迅速成为智能电视的标准配置,成为语音交互技术的另一个巨大市场。

2)智能语音空调

2017年,全国空调内销量8875.5万台,同比增长46.8%。近几年,空调每年内销量保持在6000万台以上,美的、格力、海尔、奥克斯、长虹均已推出语音智能空调,具有智能语音交互功能的空调市场空间巨大。

3)其它语音交互市场

2018年以来,具备语音识别功能的儿童故事机(机器人)、自动晾衣架等产品的出货量及增速均超过预期,带来大量的智能语音识别芯片需求。根据最新的市场调研粗略估计,全国自动晾衣架年出货量超过3000万件,儿童故事机(机器人)年出货量也有望达到4000万台。预计语音识别功能的渗透率将在未来3年超过50%。

  1. 发展态势

1)、终端语音识别芯片集成AI模块趋势明确,但是在集成方式、功能定位方面存在不同策略。

目前,运用于终端语音识别的AI芯片分为通用型、半通用型和专用型。通用型AI芯片类似CPU,AI算法直接在主控芯片的计算单元中加速,可以保证该芯片能适应不同应用场景需要,灵活性较强,但成本和功耗相对较高,例如应用于天猫智能音箱的联发科芯片。半通用型AI芯片采用异构设计,常为CPU+NN模块的方式,NN模块专门加速AI算法,CPU作为补充,意图在灵活性及成本、功耗取得折中,例如应用在小米小爱同学智能音箱的晶晨芯片。专用型芯片是针对语音识别设计的AISC芯片,实现更低的成本及功耗,灵活性稍弱。由于语音识别应用逐渐成熟,市场需求逐步明确,针对特定场景的高效率、低功耗专用型AI芯片将成为主流产品。

此外,目前上市的语音终端产品中,针对不同的应用市场,部署的AI算法复杂程度各有不同。有的仅实现离线状态下关键词唤醒,如智能音箱;有的则实现了关键词识别、离线对话等轻量级的语音语义识别,如智能家电;有的需要在离线状态下依然支持全功能的语音语义识别,如车载场景。可以推断,由于AI算法尤其是训练算法的复杂性及不断演进,语音及语音识别仍将以云端运算为主。但同时,随着语音算法的进化和终端芯片的迭代升级,终端AI语音芯片将部署更多的AI算法加速模块,以实现更快的响应速度,满足车载等多元化的场景需求,与云端训练和推理互补,提升用户体验。

2)、传统专业芯片设计公司的加入,加快了语音识别芯片的落地和量产。

国内杭州国芯、启英泰伦等AI芯片公司率先量产语音识别终端AI芯片,各音视频SOC芯片巨头公司联发科、瑞芯微、全志、晶晨也逐步推出类似产品。专业芯片设计公司与算法公司合作,凭借自身成熟的芯片设计、产品定义和成本控制能力,推出了低成本、低功耗、可离线唤醒和语音识别功能的AI芯片,应用于在智能音箱、智能家电等终端产品中,预计2019年出货量将达到千万级,未来3-5年将保持快速增长。

3、算法公司开始延伸至芯片设计环节,形成算法和芯片公司既互补又竞争的格局。

国内语音识别算法公司中,科大讯飞占据主导地位,同时有云知声、出门问问、思必驰、ROKID、依图科技等知名的初创AI公司,形成一超多强的局面。各家在算法总体水平上相对接近,各有擅长的细分领域。为了更好的将算法方案落地并通过规模化降低成本,部分语音算法公司开始自研AI芯片,推出能够加速自有算法的AI专用型芯片,帮助其更快的在特定应用领域形成落地应用。部分算法公司通过合资设立芯片公司、与传统芯片公司合作开发等多种方式进入AI芯片领域。算法及方案公司开发芯片,可以更加准确的把握其自身的功能需求,但其在产品定义、成本控制、研发周期、供应链管理等多个环节的竞争力还有待时间检验。

淘丁内容安全业务自2018年4月开始,服务于互联网平台线上产品安全审核工作,对各类违法、色情、涉政等不良违禁信息实行7*24小时即时审核,对有害信息进行人工甄别,确保产品绝对安全。

淘丁数据标注团队现有人员规模近500人,业务分部在西安、宝鸡、渭南、临汾、太原等地。淘丁与国内大型企业深入合作,日常处理项目量级均为百万级以上,部分数据量级超过千万,拥有稳定充足的业务来源。各类标注项目经验丰富,可为人员提供标准化、体系化的培训。

淘丁集团专注于互联网内容安全和数据标注业务领域,拥有千人专业团队,经验丰富,准确率高,服务类别多,团队体系成熟,能快速响应大量业务需求。

欢迎互联网公司、人工智能机构对接洽谈合作,咨询热线:029-85799062。