点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:人工智能背后的“人工”:时薪缩水一半,欠薪高发
首页> 科技频道> 综合新闻 > 正文

人工智能背后的“人工”:时薪缩水一半,欠薪高发

来源:第一财经2020-11-26 09:44

调查问题加载中,请稍候。
若长时间无响应,请刷新本页面

  “我感觉兼职标注会越来越容易被替代掉。”来自广东河源的27岁宝妈西梅(化名)对自己数据标注兼职有一种淡淡的悲观。从2018年兼职数据标注,西梅的收入已经大不如前。

  生活在贵州百鸟河小镇上的杜珉旭,是数据服务商梦动科技公司的项目组组长,除了每天协同组员完成数据标注项目,他还会抽出时间自学python语言。

  西梅和杜珉旭都是AI数据标注员,这是一个需求庞大却又曾备受争议的职业。

  标注行业给算法提供大量的训练数据。据IDC统计,全球每年生产的数据量将从2016年的16.1ZB猛增至2025年的163ZB,其中80%~90%是非结构化数据,这些数据经过清洗与标注变成了结构化数据,才能被人工智能所理解。2020年2月,“人工智能训练师”已正式成为新职业并纳入国家职业分类目录。

  业内往往说,“有多少智能,背后就有多少人工”。门槛较低,又需要大量重复的工作,这一行业生来就属于劳动密集型产业。为了降低人工成本,它多数存在于一些偏远的地区,因而往往与产业扶贫联系起来。而重复枯燥的劳动,加之过低的工资,又被人称“AI富士康”。

  机器智能发展到一定阶段后,人工是否会面临淘汰,如果淘汰那相关的劳动力又何处安放?自数据标注行业诞生,担忧与争议就没停过。如今,随着数据标注行业迭代升级,这些不同工作形式的数据标注员,都面临着能力升级的考验。

  入行门槛低

  前数据标注销售人员黄明(化名)对第一财经记者表示,作为劳动密集型产业,标注基地的员工实际上与在工厂上班的人毫无区别。在他看来,一天下来坐在电脑前标注,既繁琐重复,又给人体尤其是眼睛造成较大损伤,工资还不高。

  对于仍然从事数据标注的受访者来说,他们看法和黄明不尽相同。尽管这份工作在很多人眼里看似枯燥乏味,他们还是能找到和自己生活、喜好的结合点。

  两年前,西梅由于怀孕而不方便正常上班。她不愿跟随丈夫从事养殖业,辞去淘宝客服的工作后,在网络搜索“兼职”时发现了一家名为“爱标客”的网站,也就从那时起,西梅开始接触了数据标注行业。

  爱标客是科大讯飞旗下、连接标客和任务管理用户的服务型众包平台,为了满足其资源部或其他合作方数据标注、收集等简单工作而对外发放兼职。

  2018年刚入行时,爱标客一些简单的打框和转写校准项目,时薪在25到40元之间,一个月下来,西梅收入比早前全职做淘宝客服还高。“我比较喜欢打框,这个过程可以边听音乐边操作,方言转写校准实在是太考验人的耐性,我对声音不敏感。”西梅对第一财经记者表示。

  第一财经记者登录“爱标客”网站,发现了方言转写校准、数学解答题检查、生僻字筛选等任务,需要先申请加入团队才能领取。其中,示例视频显示,转写校准主要是调整语音频谱和语气空格,用于校准机器转写的准确度。

  西梅称,后来随着做兼职标注的人越来越多,甲方不断地压价,爱标客目前大部分项目时薪最多只有10到15元,有时候可能连10元都不到。

  由于时薪降低,她开始加入各种QQ群,寻找其他外包工作,目前时薪大约为20元,一个月下来能挣2000元到3000元不等。“养家糊口是不可能的,但是起码能做点事情赚些钱。”西梅表示。

  相比西梅兼职的标注工作,杜珉旭作为梦动科技公司的项目组的组长,一个月3000到4000不等的月薪,似乎高不了太多。但作为企业的数据标注正式员工,杜珉旭的精神状态显得更自信满满。

  早在贵州民族大学读历史学专业、临近毕业时,杜珉旭就已经在梦动科技实习。他毕业后选择在梦动科技成为数据标注员,一方面是由于对人工智能的好奇,另一方面则因为应聘的是项目组组长,可以积累管理经验。

  在梦动科技,杜珉旭的主要工作是项目测试,与客户沟通,同时给组里标注员培训,解决项目上的一些问题。平时工作强度不算高,双休以及偶尔加班,公司不仅提供免费住宿,管理层住宿还提供空调、冰箱、洗衣机,让他在生活方面有所保障。

  杜珉旭对第一财经表示,在梦动科技从事这项工作的同事,精神状态各有不同。约30%的实习同事对人工智能项目、大数据行业等都颇感兴趣。但作为劳动密集型行业,重复性标注或录制的过程较为枯燥,也使得有些同事未能适应职业而离开,岗位流动率约为10%。

  杜珉旭称,这部分人在做数据标注中,往往对行业了解比较浅显,有些仅是为了挣钱,对行业动态则较少关注。

  黄明后来跳槽到了一家做激光雷达的创业公司做销售。在他看来,数据标注行业好处之一,是能对接到许多高端企业,以最低门槛接触到人工智能领域。

  他们的共识是,对于带孩子的宝妈、农村待业人士,甚至一些残障人士,数据标注员不失为一份可以接受的工作。

  众包模式下质量与权益问题俱增

  中国的数据标注行业最早可追溯到2005年,著名计算机视觉专家、人工智能专家朱纯松从美国回到了故乡湖北鄂州,创办了莲花山研究院,筹建据称是当时世界上最早的大数据标注团队。

  2015年,随着人工智能巨头的崛起,数据标注和采集需求激增,市场真正意义上开始形成。许多数据服务公司作为乙方进入到日益扩大的市场,为百度、阿里等大型互联网公司,以及AI独角兽企业等服务。

  截至目前,数据标注产业已经遍布全国,以第三方数据服务商、巨头布置基地和众包模式呈现,例如百度山西的AI数据标注基地、贵州百鸟河的梦动科技、河北和安徽的数据堂基地,以及河南的千机数据、睿金科技,河北涞源县东团堡村等。

  梦动科技数据服务事业部总监曾芸对第一财经记者介绍,梦动属于独立的数据服务商,联动贵州盛华职业学院,对学生以产教融合的方式进行数据标注的教学和培养,从大量的实习生开始,逐渐选拔出能够适应数据标注员工作的正式员工与管理人员。

  而如同西梅的“兼职工作”,数据标注最开始的蛮荒发展,由“众包”模式而兴起。这些众包平台上一端对接项目需求公司,另一端对接大量有空余时间的志愿者(兼职人员)。这种众包结构的优点是可以组织社会上的大量兼职人员进行标注,节省公司的运营成本。

  众包存在的弊端也较为明显,分散的兼职人员,专业背景和工作能力参差不齐,沟通成本高昂,数据保密也相对困难。一旦需求公司要调整原有标注需求,兼职人员流动性大,无法灵活服务需求公司。

  西梅告诉第一财经,今年3月份疫情高峰时,她曾约到一家外包公司,据称当时一天大约数据产值能达200元,算下来一个月五六千左右工资。但真正开始测试时对方就在不停地催产量,后来由于数据验收不及格打回来返工,一个半月的时间返工了两次,最后西梅仅拿到了400多元。

  据了解,众包模式的资源对接往往通过一些微信群或QQ群。记者在QQ上搜索“数据标注”,发现了兼职群、项目资源对接群,经验交流分享群等大大小小的数据标注群。顺手加入了几个群后记者发现,群内都比较活跃:群友们经常发布项目,寻找兼职,并且每隔一段时间都会有新成员加入。同时,记者时不时地在群里看到一些标注员被项目甲方拖欠标注工资的投诉。

  众包模式也是大量数据标注员工资普遍较低的原因之一。黄明对第一财经表示,经过多层中介后,每个中介都在赚差价,因而导致的甲方成本较高,实际上真正标注的人挣的钱就比较少。

  一些做得好的数据标注员则更倾向于筹划组建团队,寻找资源单干。而这些情况越多,一方面使得数据标注行业发展快速,另一方面则造成了行业众包中介层叠越来越严重。

  对于数据标注员而言,行业的转型升级也意味着自身能力的转型升级。中国信通院报告指出,现阶段AI应用研发,数据标注是根本,10年之内都要依赖于标注数据。

  至于机器什么时候能够取代人工数据标注,至今仍没有人能说出明确答案。但第一财经记者看到,在数据标注各式各样的QQ群里,依然每天不断出现新的项目需求和个人兼职的信息,依然不断有关注数据标注行业的大量讨论。

  作者:易柏伶

[ 责编:涂子怡 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 彭丽媛会见德国伯乐中文合唱团师生代表

  • 明前茶飘香

独家策划

推荐阅读
人工智能可以取代人力勾绘农作物地块,快速完成耕地识别,工作效率相比人工作业提升数十倍。在他看来,我国在星上智能处理和地面遥感AI大模型技术上同步发力,推进人工智能遥感技术发展,太空中的卫星将变得越来越“聪明”。
2024-03-29 09:36
3月27日发表于《自然》的一项分析预测,融化的冰盖正在减缓地球的自转速度,以至于下一个闰秒将被推迟3年。论文作者之一、美国斯克里普斯海洋研究所地球物理学家Duncan Agnew说:“融冰足以使海平面上升,以至于我们可以看到地球自转速度受到了影响。
2024-03-29 09:33
胡新立表示,研究团队将进一步探讨生理性乳酸水平变化对机体代谢的意义,以及恶病质中骨骼肌萎缩与乳酸的直接关系。
2024-03-29 09:31
近日,日本小林制药保健品事件持续发酵。小林制药此前表示,该公司的红曲原料中可能含有导致消费者出现肾功能不良状态的非预期成分。小林制药出产的红曲原料除用于自家生产保健品外,还出售给其他公司,用于酿酒及食品制造等。
2024-03-29 09:22
朱雀三号可重复使用垂直起降回收验证火箭在酒泉卫星发射中心圆满完成试验任务。2023年12月,蓝箭航天朱雀二号遥三液氧甲烷运载火箭在酒泉发射中心圆满完成发射任务,将三颗商业卫星顺利送入预定轨道。
2024-03-29 09:30
记者28日从南京大学获悉,由该校物理学院杜灵杰教授领衔的国际团队利用极端条件下的偏振光散射技术,在砷化镓量子阱中对分数量子霍尔效应的集体激发进行了测量,在世界上首次观察到引力子激发,即引力子在凝聚态物质中的新奇准粒子。
2024-03-29 08:38
世界卫生组织27日发布新闻公报说,已启用“冠状病毒网络”(CoViNet),以促进和协调全球的专业知识和能力,及早准确地检测、监测和评估新冠病毒、中东呼吸综合征冠状病毒和其他可能新出现的冠状病毒。
2024-03-29 08:38
万兆元年,谁来领航?是更智慧AI,是更领先的Advance,是刷新极限的速度,还是升级多维的体验?中国移动5G-A商用发布会,重新定义数智新时代,邀您共同见证!3月28日15:00-16:00
2024-03-28 12:36
作为中国大科学装置之一,高能同步辐射光源是由中国科学院、北京市共建的怀柔科学城大科学装置集群的核心装置。
2024-03-28 09:54
2022年8月15日,国际天文学联合会小天体命名工作组发布公告,将国际永久编号为192353号的小行星命名为“王大中星”。围绕大学的根本任务是育才造士这一核心要义,王大中归纳并紧抓建设一流大学的三大要素:大师、大楼和大学精神。
2024-03-28 09:34
坎潘特强调,最新观测表明,精确的星震学技术可用于探测表面温度低至4200℃(比太阳表面低约1000℃)的矮星,为天体物理观测开辟了一个新领域。这一最新结果表明,星震学技术有望详细表征这些恒星及其宜居行星的细节,而精确确定附近冷矮星的年龄对于阐释系外行星上发现的生物特征可能至关重要。
2024-03-28 09:33
记者从自然资源部3月27日召开的例行新闻发布会上获悉:今年是极地考察40周年,自然资源部将开展一系列活动纪念这一重要时间节点。7月北极黄河站建站20周年时,在黄河站举办招待会、研讨会等相关活动,中国第四十一次南极考察期间将在长城站、中山站举行招待会、研讨会等相关活动,“雪龙”号、“雪龙2”号船停靠外港时举行公众开放日活动。
2024-03-28 09:32
联合国教科文组织执行局27日批准18处地质公园列入世界地质公园网络名录,其中包括中国的6个地质公园,分别是长白山世界地质公园、恩施大峡谷-腾龙洞世界地质公园、临夏世界地质公园、龙岩世界地质公园、武功山世界地质公园、兴义世界地质公园。
2024-03-28 09:31
据介绍,除了服务于中国探月工程四期,后续鹊桥二号中继星还可为国内外月球探测提供中继通信支持。
2024-03-28 09:25
涂白防虫、修剪树枝、引水灌溉……每当春天到来,在祖国西北边陲新疆托里县老风口,生态造林工作就紧锣密鼓地开始了。
2024-03-27 10:22
今年我国纪念“世界水日”“中国水周”的活动主题为“精打细算用好水资源,从严从细管好水资源”。
2024-03-27 10:21
在齐齐哈尔市甘南县宝山乡巨宏村,村民苑忠国正在准备春耕,多年来通过参与县里的培训,春耕物资的采购对他来说已是轻车熟路。
2024-03-27 10:20
在开展调查监测,评估新污染物环境风险状况方面,《行动方案》提出建立化学物质环境信息调查制度、建立新污染物环境调查监测制度、建立化学物质环境风险评估制度、动态发布重点管控新污染物清单等具体措施。
2024-03-27 10:18
一群“麦哲伦”式的实验物理学家正在高能物理的版图上开疆拓土。而玻色子的发现,正在指向新的“盛宴”。
2024-03-27 10:16
作为古生物学家,徐星是中国科学院院士、中国科学院古脊椎动物与古人类研究所研究员,同时也是云南大学教授,主要从事中生代陆相脊椎动物化石及地层学研究。
2024-03-27 10:15
加载更多