logo

淘丁科技分享:数据标注在金融行业会用到哪些技术?

来源:淘丁集团

在身份验证、智能投资顾问、风险管理、欺诈检测的场景需求中,人工智能技术得以广泛应用,都离不开基础数据标注的支持,其中文字翻译,语义分析,语音转录,图像标注等都是具有代表性的重要应用

一直以来,对于金融合同而言,往往需要花费律师或贷款人员大量时间进行核对与确定,而通过经语义分析处理后的数据训练,摩根大通开发了一款合同研发软件,原来需要36万个小时完成的合同审查工作,这一AI软件通过数秒即可完成检查,而错误率大大降低

常见基础数据整理工作包括:文本、语音、视频、图像标注;OCR智能转录;人脸照片采集等

语音识别

语音识别即将人类的语音中的词汇内容转化为计算机可读的输入,也就是将语音转换为文字。在金融行业尤其是银行会存在很多工作人员与用户交流的场景,比如咨询、客服、电话销售等,语音识别便在其中起到作用

目前,语音交互技术的相关应用已经成为很多金融机构的标配,客服机器人就是很典型的应用案例。语音交互技术的应用可以简化交流沟通的时间,并减少金融机构在人力成本上的支出。

此类语音交互技术主要应用到语音转写标注类型,以满足语音识别模型的需求

自然语言处理

自然语言处理(NLP)是一种专业分析人类语言的人工智能,它的工作原理如下:接受自然语言,转译自然语言,分析自然语言并输出结果。常见的自然语言处理应用包括语义分析、信息抽取、文本挖掘、机器翻译等内容

在金融行业,自然语言处理的主要应用场景包括机器翻译、数据检索、语音识别、智能客服、情感分析等比如,目前很多机构都提供文字机器人客服服务,这背后就有自然语言处理技术的支撑。通过对文本内容进行语义分析,判别其意图,最终通过文本合成形成应答

此类自然语言处理技术主要应用到实体识别、OCR转写、文本分类等标注类型

计算机视觉

计算机视觉即指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。在金融行业主要应用于内部流程优化以及客户交互服务领域,人脸识别、活体检测、客户交互等是比较典型的应用场景

这类场景的特点是简单、重复性比较高,如现在的刷脸支付,用户只需要进行“刷脸”,就可以完成身份验证、支付等流程。此类计算机视觉技术主要应用到关键点、2D框等标注类型,以满足人脸识别技术的需要。因为涉及到人脸等敏感信息,对于数据标注服务供应商的数据安全把控能力提出了更高的要求

人工智能与金融行业的结合深刻改变了传统金融业态,重塑了金融行业新生态。未来,随着人工智能技术的进一步成熟,在场景覆盖以及垂直应用领域,可供作为的空间将更加广阔

在智慧金融落地过程中,除了搭建AI中台相关平台以外,花费时间最多的是与数据相关的过程,无论是模型训练,还是知识图谱构建,很多时间用在获取数据和探索数据。

淘丁内容安全业务自2018年4月开始,服务于互联网平台线上产品安全审核工作,对各类违法、色情、涉政等不良违禁信息实行7*24小时即时审核,对有害信息进行人工甄别,确保产品绝对安全。

淘丁数据标注团队现有人员规模近500人,业务分部在西安、宝鸡、渭南、临汾、太原等地。淘丁与国内大型企业深入合作,日常处理项目量级均为百万级以上,部分数据量级超过千万,拥有稳定充足的业务来源。各类标注项目经验丰富,可为人员提供标准化、体系化的培训。

淘丁集团专注于互联网内容安全和数据标注业务领域,拥有千人专业团队,经验丰富,准确率高,服务类别多,团队体系成熟,能快速响应大量业务需求。

欢迎互联网公司、人工智能机构对接洽谈合作,咨询热线:029-85799062