点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:人工智能背后的“人工”:时薪缩水一半,欠薪高发
首页> 科技频道> 综合新闻 > 正文

人工智能背后的“人工”:时薪缩水一半,欠薪高发

来源:第一财经2020-11-26 09:44

调查问题加载中,请稍候。
若长时间无响应,请刷新本页面

  “我感觉兼职标注会越来越容易被替代掉。”来自广东河源的27岁宝妈西梅(化名)对自己数据标注兼职有一种淡淡的悲观。从2018年兼职数据标注,西梅的收入已经大不如前。

  生活在贵州百鸟河小镇上的杜珉旭,是数据服务商梦动科技公司的项目组组长,除了每天协同组员完成数据标注项目,他还会抽出时间自学python语言。

  西梅和杜珉旭都是AI数据标注员,这是一个需求庞大却又曾备受争议的职业。

  标注行业给算法提供大量的训练数据。据IDC统计,全球每年生产的数据量将从2016年的16.1ZB猛增至2025年的163ZB,其中80%~90%是非结构化数据,这些数据经过清洗与标注变成了结构化数据,才能被人工智能所理解。2020年2月,“人工智能训练师”已正式成为新职业并纳入国家职业分类目录。

  业内往往说,“有多少智能,背后就有多少人工”。门槛较低,又需要大量重复的工作,这一行业生来就属于劳动密集型产业。为了降低人工成本,它多数存在于一些偏远的地区,因而往往与产业扶贫联系起来。而重复枯燥的劳动,加之过低的工资,又被人称“AI富士康”。

  机器智能发展到一定阶段后,人工是否会面临淘汰,如果淘汰那相关的劳动力又何处安放?自数据标注行业诞生,担忧与争议就没停过。如今,随着数据标注行业迭代升级,这些不同工作形式的数据标注员,都面临着能力升级的考验。

  入行门槛低

  前数据标注销售人员黄明(化名)对第一财经记者表示,作为劳动密集型产业,标注基地的员工实际上与在工厂上班的人毫无区别。在他看来,一天下来坐在电脑前标注,既繁琐重复,又给人体尤其是眼睛造成较大损伤,工资还不高。

  对于仍然从事数据标注的受访者来说,他们看法和黄明不尽相同。尽管这份工作在很多人眼里看似枯燥乏味,他们还是能找到和自己生活、喜好的结合点。

  两年前,西梅由于怀孕而不方便正常上班。她不愿跟随丈夫从事养殖业,辞去淘宝客服的工作后,在网络搜索“兼职”时发现了一家名为“爱标客”的网站,也就从那时起,西梅开始接触了数据标注行业。

  爱标客是科大讯飞旗下、连接标客和任务管理用户的服务型众包平台,为了满足其资源部或其他合作方数据标注、收集等简单工作而对外发放兼职。

  2018年刚入行时,爱标客一些简单的打框和转写校准项目,时薪在25到40元之间,一个月下来,西梅收入比早前全职做淘宝客服还高。“我比较喜欢打框,这个过程可以边听音乐边操作,方言转写校准实在是太考验人的耐性,我对声音不敏感。”西梅对第一财经记者表示。

  第一财经记者登录“爱标客”网站,发现了方言转写校准、数学解答题检查、生僻字筛选等任务,需要先申请加入团队才能领取。其中,示例视频显示,转写校准主要是调整语音频谱和语气空格,用于校准机器转写的准确度。

  西梅称,后来随着做兼职标注的人越来越多,甲方不断地压价,爱标客目前大部分项目时薪最多只有10到15元,有时候可能连10元都不到。

  由于时薪降低,她开始加入各种QQ群,寻找其他外包工作,目前时薪大约为20元,一个月下来能挣2000元到3000元不等。“养家糊口是不可能的,但是起码能做点事情赚些钱。”西梅表示。

  相比西梅兼职的标注工作,杜珉旭作为梦动科技公司的项目组的组长,一个月3000到4000不等的月薪,似乎高不了太多。但作为企业的数据标注正式员工,杜珉旭的精神状态显得更自信满满。

  早在贵州民族大学读历史学专业、临近毕业时,杜珉旭就已经在梦动科技实习。他毕业后选择在梦动科技成为数据标注员,一方面是由于对人工智能的好奇,另一方面则因为应聘的是项目组组长,可以积累管理经验。

  在梦动科技,杜珉旭的主要工作是项目测试,与客户沟通,同时给组里标注员培训,解决项目上的一些问题。平时工作强度不算高,双休以及偶尔加班,公司不仅提供免费住宿,管理层住宿还提供空调、冰箱、洗衣机,让他在生活方面有所保障。

  杜珉旭对第一财经表示,在梦动科技从事这项工作的同事,精神状态各有不同。约30%的实习同事对人工智能项目、大数据行业等都颇感兴趣。但作为劳动密集型行业,重复性标注或录制的过程较为枯燥,也使得有些同事未能适应职业而离开,岗位流动率约为10%。

  杜珉旭称,这部分人在做数据标注中,往往对行业了解比较浅显,有些仅是为了挣钱,对行业动态则较少关注。

  黄明后来跳槽到了一家做激光雷达的创业公司做销售。在他看来,数据标注行业好处之一,是能对接到许多高端企业,以最低门槛接触到人工智能领域。

  他们的共识是,对于带孩子的宝妈、农村待业人士,甚至一些残障人士,数据标注员不失为一份可以接受的工作。

  众包模式下质量与权益问题俱增

  中国的数据标注行业最早可追溯到2005年,著名计算机视觉专家、人工智能专家朱纯松从美国回到了故乡湖北鄂州,创办了莲花山研究院,筹建据称是当时世界上最早的大数据标注团队。

  2015年,随着人工智能巨头的崛起,数据标注和采集需求激增,市场真正意义上开始形成。许多数据服务公司作为乙方进入到日益扩大的市场,为百度、阿里等大型互联网公司,以及AI独角兽企业等服务。

  截至目前,数据标注产业已经遍布全国,以第三方数据服务商、巨头布置基地和众包模式呈现,例如百度山西的AI数据标注基地、贵州百鸟河的梦动科技、河北和安徽的数据堂基地,以及河南的千机数据、睿金科技,河北涞源县东团堡村等。

  梦动科技数据服务事业部总监曾芸对第一财经记者介绍,梦动属于独立的数据服务商,联动贵州盛华职业学院,对学生以产教融合的方式进行数据标注的教学和培养,从大量的实习生开始,逐渐选拔出能够适应数据标注员工作的正式员工与管理人员。

  而如同西梅的“兼职工作”,数据标注最开始的蛮荒发展,由“众包”模式而兴起。这些众包平台上一端对接项目需求公司,另一端对接大量有空余时间的志愿者(兼职人员)。这种众包结构的优点是可以组织社会上的大量兼职人员进行标注,节省公司的运营成本。

  众包存在的弊端也较为明显,分散的兼职人员,专业背景和工作能力参差不齐,沟通成本高昂,数据保密也相对困难。一旦需求公司要调整原有标注需求,兼职人员流动性大,无法灵活服务需求公司。

  西梅告诉第一财经,今年3月份疫情高峰时,她曾约到一家外包公司,据称当时一天大约数据产值能达200元,算下来一个月五六千左右工资。但真正开始测试时对方就在不停地催产量,后来由于数据验收不及格打回来返工,一个半月的时间返工了两次,最后西梅仅拿到了400多元。

  据了解,众包模式的资源对接往往通过一些微信群或QQ群。记者在QQ上搜索“数据标注”,发现了兼职群、项目资源对接群,经验交流分享群等大大小小的数据标注群。顺手加入了几个群后记者发现,群内都比较活跃:群友们经常发布项目,寻找兼职,并且每隔一段时间都会有新成员加入。同时,记者时不时地在群里看到一些标注员被项目甲方拖欠标注工资的投诉。

  众包模式也是大量数据标注员工资普遍较低的原因之一。黄明对第一财经表示,经过多层中介后,每个中介都在赚差价,因而导致的甲方成本较高,实际上真正标注的人挣的钱就比较少。

  一些做得好的数据标注员则更倾向于筹划组建团队,寻找资源单干。而这些情况越多,一方面使得数据标注行业发展快速,另一方面则造成了行业众包中介层叠越来越严重。

  对于数据标注员而言,行业的转型升级也意味着自身能力的转型升级。中国信通院报告指出,现阶段AI应用研发,数据标注是根本,10年之内都要依赖于标注数据。

  至于机器什么时候能够取代人工数据标注,至今仍没有人能说出明确答案。但第一财经记者看到,在数据标注各式各样的QQ群里,依然每天不断出现新的项目需求和个人兼职的信息,依然不断有关注数据标注行业的大量讨论。

  作者:易柏伶

[ 责编:涂子怡 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 广西南宁:春运启动 整装待发

  • 成都大运会新建场馆全部完成主体结构施工

独家策划

推荐阅读
世界卫生组织28日公布的新冠疫情最新数据显示,全球累计确诊病例已超1亿例。
2021-01-28 21:24
转基因玉米更不会引起老鼠患癌、母猪会流产、不孕不育等问题。
2021-01-28 09:58
星上在轨触发定位软件实时捕捉到该爆发事件后约60秒,“极目”卫星科学运行中心收到第一条北斗短报文,其后10分钟内收到所有短报文信息。作为“极目”卫星首个在轨触发定位以及通过短报文准实时下行观测警报的伽马暴,“极目”卫星团队通过国际伽马暴协调网络(GCN)发布了观测通告。
2021-01-28 09:27
朱红介绍,根据全国青少年生涯教育调查报告,在“选科决策的主要意见来源”一项中,95%的学生选择了个人意愿。不可否认的是,我国的生涯课程建设还处在起步阶段,多数高中学校的生涯教育课程还没有形成统一的课程目标体系。
2021-01-28 09:36
经过了3个多月的校内讨论后,1月中旬,天津大学正式发布“一流研究生教育行动计划”,从思想政治教育、资源配置优化、课程体系建设、导师队伍建设、学科交叉培养、国际合作培养、质量保障机制、分类评价机制8个方面提出研究生教育改革的“八大任务”。据了解,天津大学将在部分特色学科试点“完全学分制”改革,针对研究生突出“研”的学习特点,构建更加开放自主的选课机制。
2021-01-28 09:35
1月19日,节能与新能源汽车产业发展部际联席会议明确今年新能源汽车产业发展四项重点工作。据中国汽车工业协会数据,2020年,我国新能源汽车产销分别完成136.6万辆和136.7万辆,同比分别增长7.5%和10.9%,销量创历史新高。
2021-01-28 09:35
随着一座座高楼大厦拔地而起,电梯早已成为人们生活中必不可少的一部分。1月18日,在首届家用电梯行业峰会上,专家指出,今年将是国产高端家用电梯元年,随着市场集中度的提高,预计未来几年,高端家用电梯行业将面临一次大洗牌。
2021-01-28 09:34
过去要求科研人员将做科研的费用分为很多科目,比如设备费、材料费、分析测试化验加工费,还有国际交流合作费、专家咨询费等科目,申报起来十分繁杂。从2019年4月至2020年7月,山东、重庆、广西、广东等省市陆续启动试点工作,涉及省级自然科学基金、自然科学青年基金、杰出青年项目、优秀人才项目等。
2021-01-28 09:34
截至2020年底,我国国内(不含港澳台)发明专利有效量221.3万件,每万人口发明专利拥有量达到15.8件,累计批准地理标志产品2391个,核准专用标志使用企业9479家,累计注册地理标志商标6085件。
2021-01-28 09:34
由日本藤田医科大学、名古屋大学、京都大学等大学研究人员组成的一个研究团队,对血管内大B细胞淋巴瘤(IVLBCL)患者血液中存在的淋巴瘤细胞源基因组进行了详细的基因分析,通过高灵敏度检测,确定了表征此病的基因异常。
2021-01-28 09:33
这种剪切和修复几乎在每一代中都是随机发生的,由此可以画出非常精细的癌细胞演化图谱——显示转移的癌细胞在体内的扩散路径和方向。研究人员还发现,许多癌细胞转移的第一步是从肺部转移到纵隔淋巴组织这个“中转枢纽”,这表明在小鼠模型中,这一部位与癌细胞向体内扩散密切相关。
2021-01-28 09:33
”  美国制药商礼来公司1月21日称,他们的抗体药物可以防止养老院和其他长期护理机构的居民及工作人员患上新冠肺炎。美国食品和药品监督管理局已经批准礼来和再生元公司的单克隆抗体的紧急使用授权,将其用于某些人群中作为治疗药物。
2021-01-28 09:32
英国《自然》杂志27日发表一项神经科学研究,瑞士及加拿大科学家团队利用改良的“神经假体”,成功实现一种脊髓刺激疗法,可以恢复那些脊髓损伤啮齿动物和非人灵长类维持正常血压的能力。
2021-01-28 09:32
据美国《每日科学》网站最新消息,澳大利亚新南威尔士大学的科学家开发出一种陶瓷基“墨水”,可让外科医生3D打印出带有活细胞(用于修复受损的骨组织)的骨骼。
2021-01-28 09:32
盛夏的野外,萤火虫一闪一灭的光亮,犹如一盏盏神秘莫测的明灯。研究人员在白垩纪中期缅甸琥珀(约1亿年前)中发现了一枚保存较完好的阿扎白垩光萤雄性标本。研究人员推测,白垩光萤中的发光器官或许与抵御这些捕食者有关。
2021-01-28 09:31
那个戴着黑框眼镜、身形瘦削的中核集团中国原子能科学研究院反应堆工程技术研究部(以下简称堆工部)运行所所长王玉林,停下了匆匆步伐。很多时候,中国先进研究堆开堆和试验都是在周末或晚上,王玉林总会来到主控室,一定要等到反应堆稳定运行了才放心。
2021-01-28 09:30
“全年电信业务总量(按上年不变价计算)同比增长20.6%,软件和信息服务业收入比上年增长13.3%。在提升应用创新能力方面,培育5G+增强现实、5G+虚拟现实、沉浸式游戏等新兴消费模式,推进5G融入健康、养老、家政等生活服务。
2021-01-28 09:28
记者从中国科学技术大学获悉,由该校天文系发起,中国、美国、智利天文学家参与的“宇宙再电离时期的莱曼阿尔法星系”(LAGER)研究项目再获突破性进展。
2021-01-28 09:27
1月26日,第十一次中国公民科学素质抽样调查结果发布,2020年公民具备科学素质的比例达到10.56%,较2015年的6.20%提高了4.36个百分点,完成了《国民经济和社会发展第十三个五年规划纲要》提出的2020年“公民具备科学素质的比例超过10%”的目标任务。
2021-01-27 09:24
2021年1月26日傍晚Nature网站以头条新闻的方式刊出了题为“著名中国免疫学家没有剽窃和学术造假”的新闻并配以曹雪涛的照片,该新闻大篇幅报道了科技部等多部门对于中国工程院院士曹雪涛的联合调查官方结论和处理措施并刊登了曹雪涛的回应,新闻的最后部分介绍了对于李红良、耿美玉、裴钢、饶毅四位著名中国科学家的调查结论。
2021-01-27 09:57
加载更多