logo

淘丁数据标注:机器越“智能”,数据标注员越容易被淘汰?

来源:淘丁集团

有这样一类人,他们是AI行业的赋能者,是智能时代的奠基人,他们就是人工智能背后的“人工”——数据标注员。

数据标注员的职责是帮助机器习得“知识”,或者换一种说法,他们的想法决定了AI的想法。AI繁荣的这些年,有数以亿兆级的数据信息传递到标注师的电脑前,被他们手动“智能化”。

而如今,随着数据标注不断迭代升级,很多人担心数据标注师或许很快就会离开时代舞台…… 原因背后,无疑是数据标注员的工作特点导致,首先让我们来了解一下数据标注员都做些什么。

淘丁数据标注:机器越“智能”,数据标注员越容易被淘汰?插图

如何成为一名数据标注员
数据标注发展到现在,“数据标注员就是AI的老师”这种说法已然不太准确,因为老师只负责“教”,无需对特定情况下的结果负责。而标注则不然,这是一个技术活,作为一名标注员需要对标记物体进行拉框、标点等,让计算机学习什么是人脸、什么是车辆、如何听懂方言、一句话可以有多少层含义等等。

因此,这就是大多数人将数据标注员描述为每天上班只需动动鼠标即可的原因。从标注小白到标注成手只需经过几天的培训就能做到,而这种易上手的工作也成为了许多地区“脱贫”的重点培养产业。

数据标注集中地区
在数据标注刚兴起的那几年,各大互联网巨头纷纷意识到数据的重要性,并着手建立了自己的数据基地。但值得注意的是,这些大厂并没有将基地建在发达地区,而是选择了那些相对较贫困的地区。例如百度将数据总基地建在了山西,阿里、华为选择了贵州,腾讯则直接将平台放在线上,让数据标注成为了“全民兼职”。

除各大厂商外,许多贫困山区也选择引入数据标注行业,培养当地村民成为数据标注员,实现脱贫奔小康。

所以,既然连没碰过电脑的村民也可以成为数据标注员,从事数据标注员的主要都是哪类人呢?

数据标注人群主要都有哪些
业内人士评估,全职的数据标注员如今已达10万人,兼职人群的规模更是达到100万。

这其中,学生占了很大一部分,尤其是职业学校的学生,这些学生唯一能触碰到人工智能影子的工作就是数据标注。并且随着大厂的介入,市场最后比拼的就是成本,许多大厂会将数据包给中型数据标注公司,而这类公司又将数据分给小型公司、小型团队,有的团队甚至还会继续将数据分散下去,层层叠加,利润早已所剩无几。所以,学生,尤其是那些还没毕业的在校学生,就成为了最好的劳动力。

除去学生外,许多步入社会的人也在该行业里徘徊,这其中包括失业的白领、山区农民、甚至连残障人士也能成为数据标注的一员,他们有的希望利用这个行业过渡、有的靠它养家糊口。总之,这个行业的优势很明显,极低的门槛让它成为许多社会底层人士的救命稻草。

而优点往往也是缺点,门槛低意味着可替代性强,许多数据标注员已察觉到这点,但苦于对这个行业的未来没有规划。在劳累的工作之余,想到自己终有一天会被替代,焦虑感随之而来,累着身体,心理也同样在内耗。

其实,数据标注行业的前景非常广阔,且随着人工智能的不断拓进,这一行业将会越来越辉煌。作为数据标注员,要如何做才能抓住时代的桥梁,成就自己?

数据标注员如何转业
随便一翻网络上对数据标注员的评价,“没前途、没技术、末位淘汰制、无脑机器….”,这种持悲观想法的评论比比皆是。而静下心想一想,任何一门行业刚入门槛时都会面临易被淘汰的风险,在行业初期职业类型单一是很正常的。对于缺少技术傍身的普通人,最小的投入与最易得的经验才是硬道理。

而对于已经入职较长时间的标注老手来说,转型的方向无疑分为两条:技术或管理层面。下图为数据标注相关职位类型,可以尝试先从审核员做起,再慢慢过渡到其他职位中。

对于那些想继续从事数据标注行业的人,深化自己的专业知识极其重要。国家去年颁布的新职业——人工智能训练师,正是打破现状的绝佳机会。

人工智能训练师共有五个等级,数据标注仅是浅显的表皮工作,作为人工智能训练师,还要熟悉机器学习的基本算法,提供合理的行业解决方案,其次该职业对理解力也有较高要求,需要训练师分析客户语料,完成校验工作,并不断优化丰富产品知识库,完成人机交互设计的管理及各种辅助工作等等。

现阶段,新兴职业的出现意味着数据标注将愈加专业规范化,数据标注不再是一个劳动密集型行业,更是知识密集型产业,努力提升自己的等级,成为优秀的人工智能训练师也会是不错的出路

结语
马云曾有一句名言:“很多人因为看见才相信,只有少数人相信才看见。”

数据标注员——正如别人评论的那样,他们的工作的确很像数字世界的建筑工人,但是他们扮演着很重要的角色,因为没有他们,AI这栋摩天大楼就无法建成。

在人工智能行业愈加发达的今天,顶层算法需要海量数据辅助,而数据必须由人工完成,所以人工智能的未来仍将依靠各位标注员的共同努力与坚守

淘丁数据标注:机器越“智能”,数据标注员越容易被淘汰?插图1

淘丁内容安全业务自2018年4月开始,服务于互联网平台线上产品安全审核工作,对各类违法、色情、涉政等不良违禁信息实行7*24小时即时审核,对有害信息进行人工甄别,确保产品绝对安全。

淘丁数据标注:机器越“智能”,数据标注员越容易被淘汰?插图2

淘丁数据标注团队现有人员规模近500人,业务分部在西安、宝鸡、渭南、临汾、太原等地。淘丁与国内大型企业深入合作,日常处理项目量级均为百万级以上,部分数据量级超过千万,拥有稳定充足的业务来源。各类标注项目经验丰富,可为人员提供标准化、体系化的培训。

淘丁数据标注:机器越“智能”,数据标注员越容易被淘汰?插图3

淘丁集团专注于互联网内容安全和数据标注业务领域,拥有千人专业团队,经验丰富,准确率高,服务类别多,团队体系成熟,能快速响应大量业务需求。

欢迎互联网公司、人工智能机构对接洽谈合作,咨询热线:029-85799062