logo

淘丁数据标注:什么是情感标注?

来源:淘丁集团

什么是情感标注?

情感标注是针对一些对话数据,对音频内的人物语言内容进行情绪意图的判定,比如:表达疑问、需求或投诉建议等等。

我们可以根据当时的情景,然后用语言表达出可以预料的感情,就可以定位他们的感受,把它们变成语言,再把他们当时表达的情绪重复给他们听,这种过程,就叫作“标注”。
给他人的情感进行命名,然后把你认为对方所拥有的情感用语言的方式表达出来,这能让你知道一些未知信息。

情感标注大致可划分为四类:

一是主客观分类;

二是情感极性分类,包括正面、负面、中性;

三是情感分类,是按范畴、维度或语言学理论进行分类;

四是细致观点划分,可分为实体、情感、观点持有者等。

由此可见,为满足现代应用,情感标注正趋于细粒度化发展。

情感标注的步骤?

一是接收待标注文,是采用预先训练好的至少一个训练模型对待标注文本进行情感分析,确定待标注文本的情感标签;

二是采用预先训练好的至少一个训练模型对待标注文本进行情感分析,来确定待标注文本的情感标签,并结合情感词提取和将情感词转换为词的特征向量来进行模型训练,并对待识别文本进行情感标注,优化我们的情感表达能力,同时,提高了训练模型对情感分析的准确率。

三是待标注文本标注情感标签可以优化情感表达能力,这也可以提高训练模型对情感分析的准确率。

情感标注的标注标准

情感标注缺乏统一建设标准,尤其是标注标准,这也导致语料库建设各不统一,严重阻碍了资源共享。

标注随意性体现于:标注模式分为TEI、CES、COCOA;标记语言包括SGML、XML、自定义置标语言;标签集是同一标签在不同语料库中有不同含义;标注形式包含了内嵌式标注和分离式标注。

情感标注的作用是什么?

据研究表明,人的情感分为两个层面:一是“展示”,指的是在在表面能被看到和听到的言行;二是“潜在”,指的是使人做出行为的感觉。对情感进行标注,可以很好的让我们知道客户的情感,有助于行业的发展。

淘丁内容安全业务自2018年4月开始,服务于互联网平台线上产品安全审核工作,对各类违法、色情、涉政等不良违禁信息实行7*24小时即时审核,对有害信息进行人工甄别,确保产品绝对安全。

淘丁数据标注团队现有人员规模近500人,业务分部在西安、宝鸡、渭南、临汾、太原等地。淘丁与国内大型企业深入合作,日常处理项目量级均为百万级以上,部分数据量级超过千万,拥有稳定充足的业务来源。各类标注项目经验丰富,可为人员提供标准化、体系化的培训。

淘丁集团专注于互联网内容安全和数据标注业务领域,拥有千人专业团队,经验丰富,准确率高,服务类别多,团队体系成熟,能快速响应大量业务需求。

欢迎互联网公司、人工智能机构对接洽谈合作,咨询热线:029-85799062。