最新要闻
- 出游人次破亿 端午假期旅游需求持续释放
- 环球视讯!汪小菲晒一双儿女合影,网友评价戳心,内涵大S作为妈妈的不作为|时快讯
- 内蒙古加强暑期旅游市场安全管理
- 引进项目200多个 60多个项目投运 落地产品1000余种 新区全力打造千亿级绿色化工园区
- 新时达:目前与华为暂无工业机器人业务方面合作 世界新要闻
- 环球速看:河南:产教融合助力服装产业数智化人才培育
- 2023河南高招咨询大会在郑州启幕 逾700所高校为考生“面对面”答疑
- (共话中国经济新机遇)专访:世界对中国的发展与机遇充满期待——访世界经济论坛总裁布伦德 每日讯息
- 2023版30克熊猫银币现在市场价是多少(2023年06月26日)
- 618初战扫地机器人增速第一,石头科技大涨近10%|世界快消息
- 快看点丨短讯!热推荐:当前热点-天天头条:新消息丨即时焦点:世界看点:智利进口硼酸商品报价动态(2023-06-25) 天天热议 最新资讯|每日视讯-今日快讯
- 魅族与极星汽车合作成立合资公司
- 排列三2023167期祥龙看三预测
- 【全球新视野】年内累计发行176只新股,共募资2106.30亿元
- 韩国“萨德”部署地民众持续抗议 强烈谴责执政党代表团访问|每日看点
- 天天看热讯:高铁票抵进项报税怎么填(高铁票抵扣填申报表哪一栏)
手机
浦东这个街道开启“志愿者+”增能培训,推动新时代文明实践工作再上新台阶
观焦点:国铁集团:端午5天全国铁路送客逾7000万
- 浦东这个街道开启“志愿者+”增能培训,推动新时代文明实践工作再上新台阶
- 观焦点:国铁集团:端午5天全国铁路送客逾7000万
- 环球热门:博创科技:400G-DR4模块已实现量产出货
- 产业一线招人难,韩国将增发外籍熟练劳工长期就业签证 天天热讯
- 天天快资讯:武汉火影数字|房地产宣传片拍摄制作公司 地产三维动画宣传片
- 日本东电移除核污染水排海隧道施工重型设备,排海工程即将完工 焦点简讯
家电
揭秘真实的「AI民工」:为生存机械地「做任务」 时薪低至1美元
核心提示:
1.即使是最厉害的AI背后也是人,它需要大量人力标注数据来训练它。AI标注员是人们希望自动化的工作,而且通常认为它们已经自动化了,但是仍需要人类的辅助。
【资料图】
2.他们把这份工作称为“做任务”,自己也不知道干的是什么。
3.收入微薄,时薪低至1-3美元。
4.标注员抱怨称“如果我让某人成为亿万富翁,而我每周只赚几美元,我真的是在浪费生命。”
人工智能(AI)的火热不仅取代了一批工作岗位,也造就了新的产业,一支以“做任务”为生的庞大AI民工大军正在悄然崛起中。
乔(Joe)今年30岁,几个月前从肯尼亚首都内罗毕的一所大学毕业,找到了一份数据标注员的工作。这份工作单调乏味,整天就是处理用于训练AI的原始信息。AI通过在海量数据中寻找模式来学习,但是这些数据首先必须由人类进行分类和标记。人类就是隐藏在这些机器背后的庞大劳动力。
以乔为例,他的工作就是为自动驾驶汽车标记视频,一帧一帧地从每个可能的摄像头角度标记每辆车、行人、骑自行车的人以及任何车主需要注意的东西。这是一项艰难而又重复性的劳动。一个只有几秒钟的视频片段需要8个小时来标注,乔忙活半天只能赚到大约10美元(约合72元人民币)。
不过,到了2019年,乔迎来了一个“发财机会”。由于一家新公司迫切需要标注员,他们成立了一个训练营,培养新的标注员。乔成了这个训练营的负责人,报酬是之前做标注员的四倍。
每隔两周时间,50名新手就会排队进入内罗毕的一栋办公楼,开始他们的学徒生涯,这让人感觉市场对标注员的需求似乎是无限的。他们被要求从那些对着镜子自拍的照片中看到的衣服进行分类,通过机器人吸尘器的视角来确定他们所在的房间,并在激光雷达扫描的摩托车周围画出正方形。
乔的一半以上学生通常在训练营结束前就退学了。“有些人不知道如何长时间待在一个地方。”他委婉地解释道。他承认,“这很无聊”。
稀里糊涂“做任务”
但是,在一个工作稀缺的地方,这好歹是一份能够糊口的工作。最终,乔还是培养出了数百名毕业生。训练营结束后,这些学生回到家里,独自在卧室和厨房里工作,被禁止告诉任何人他们在做什么。其实,保密性并不是什么问题,因为他们也几乎不知道自己在干什么。
对于这些刚出师的学生来说,为自动驾驶汽车标记障碍物很好明白,但是对那些不知道是机器人还是人类说的扭曲对话片段进行分类,就没那么轻松了。他们要上传自己的照片:先是一脸茫然地盯着摄像头,然后咧着嘴笑,还要戴上摩托车头盔。每个项目都是某个更大程序的一个很小组成部分,所以很难说他们到底在训练AI做什么。他们也无法从这些项目的名称中寻找蛛丝马迹:“蟹的传人”、“鲸鱼段”、“林地陀螺仪”和“药盒香肠”,这些都是不着边际的项目代号。
那么,他们到底是在为谁打工呢?大多数人只知道它叫Remotasks,是一家面向英语流利者提供工作的网站。和大多数标注员一样,乔并不知道Remotasks是美国AI标注公司Scale AI旗下的外包公司。Scale AI是一家价值数十亿美元的硅谷数据供应商,客户包括OpenAI和美国军方。不过,Remotasks和Scale AI的网站都没有提到双方的关系。
许多人对于ChatGPT等大语言模型的关注都集中在AI通过自动化取代的工作岗位上。但是,即使是最厉害的AI背后也是人,它需要大量人力标注数据来训练它,并在它感到“困惑”时对数据进行澄清。只有那些有钱购买这些数据的公司才能参与竞争,这些公司在得到数据后会极力防止数据外泄。结果就是,除了少数例外情况以外,人们对于塑造AI系统行为的信息知之甚少,对于塑造这些系统行为的人就更不了解了。
对乔的学生来说,这是一份“十分不正常”的工作:没有时间表、没有同事、不知道自己在做什么、也不知道为谁工作。实际上,他们很少把这项劳动称之为工作,只是称之为“任务”,他们是任务工作者。
人类学家大卫·格雷伯(David Graeber)曾经给那些没有意义的工作起了一个名字:“狗屁工作”,指的是那些本应该被自动化取代,但由于官僚主义、地位或惰性等原因而没有自动化的工作。AI标注员的工作则与之相反:这是人们希望自动化的工作,而且通常认为它们已经自动化了,但是仍需要人类代替。这些工作确实有一个目的,只是工作者通常不知道它是什么。
标注大生意
当前的AI热潮,就是源自这种前所未有的大规模单调乏味、重复性劳动。
2007年,时任普林斯顿大学教授的AI研究员李飞飞怀疑,改善图像识别神经网络的关键是使用更多数据进行训练,需要数百万标记图像而不是数万张。但问题是,她的本科生团队需要花费数十年时间和数百万美元才能给这么多照片贴上标签。
不过,当时亚马逊已经拥有了一个众包平台Mechanical Turk,世界各地的人们在这里以低廉的价格完成小任务。于是,李飞飞在Mechanical Turk上找到了数千名数据标注工作者,创造了标注数据集ImageNet。它让机器学习取得了突破,让这一领域焕发新机,迎来了十年进步。
如今,标注仍然是AI开发的基础组成部分。但是,工程师们经常觉得,对于构建大模型这一更迷人的工作而言,标注是一个短暂的、不方便的先决条件。你可以尽可能便宜地收集尽可能多的标记数据来训练模型,如果它有效,至少在理论上你就不再需要标注员了。但是,标注永远不会真正完成。在研究人员眼里,机器学习系统是“脆弱的”。当遇到训练数据中没有充分解释的东西时,它很容易失败。这些失败被称为“边缘情况”,可能会产生严重的后果。
例如,2018年,网约车巨头Uber的一辆自动驾驶测试车撞死了一名女性。尽管该汽车的自动驾驶系统被进行了编程,要求避开骑自行车的人和行人,但它不知道该如何对待骑自行车过马路的人。随着越来越多的AI系统被投入到世界中提供法律咨询和医疗帮助,它们面临的边缘情况就越多,需要更多人类来协助解决。这已经催生了一个全球性产业,由像乔这样的人组成,他们用自己独特的人类能力来帮助机器。
标注是一门大生意。Scale AI由当年19岁的亚历山大·王(Alexandr Wang)在2016年创立,2021年的估值已达到73亿美元,这让他登上了《福布斯》“最年轻的白手起家亿万富翁”榜单。不过,自那以后,他的股份在二级市场的价值已经下跌。
“标注生意拥有一套完整的供应链,”非营利组织AI伙伴关系(Partnership on AI)的项目和研究负责人索南·金达尔(Sonam Jindal)表示,“业内普遍认为,标注不是开发的关键部分,也不会长时间需要它。所有的兴奋之情都围绕着人工智能,一旦我们建立了它,就不再需要标注,所以为什么要考虑它呢?但标注是AI的基础设施。人类智慧是AI的基础,我们需要将其视为AI经济中的真正工作,这些工作将在一段时间内存在。”
OpenAI、谷歌和微软等知名AI公司都有各自的数据供应商。一些私人外包公司拥有类似呼叫中心的办公室,比如肯尼亚和尼泊尔的CloudFactory。乔就是在那里做标注,每小时1.2美元,之后他才转投Remotasks。还有像Mechanical Turk和Clickworker这样的“众包”网站,任何人都可以注册来完成任务。中间层是Scale AI之类的服务,任何人都可以注册,但每个人都必须通过资格考试和培训课程,并接受绩效监控。
怎么接活?
今年早些时候,记者在Scale AI的外包公司Remotasks网站上进行了注册。过程很简单,输入电脑配置、网速和一些基本的联系信息后,记者就来到了“培训中心”。为了获得付费任务,记者首先必须完成一个相关的无偿入门课程。
培训中心展示了一系列课程,但是这些课程的名字令人费解,比如“胶水泳衣”和“海报夏威夷”。记者点开了一个叫“GFD模块化”的课程,这项课程是给社交媒体照片中的衣物进行标注。
不过,课程的指令很奇怪。例如,它们基本上是由相同的指令组成的,并用特殊的颜色和大写字体进行强调,旁边是用来警示的炸弹威胁拼贴画。
“一定要给真实的、可以让人类穿着或打算给真人穿着的物品贴上标签。”指令是这么要求的。
“下面的所有物品都应该贴上标签,因为它们是真实的,可以被现实生活中的人穿着。”指令再次强调。这些物品来自一个AJ品牌广告、一个戴着星球大战凯洛伦头盔的人,以及一个穿着裙子的人体模型。这些图片上面有一个石灰绿色的方框,里面的文字再次解释说,“给真实的人可以穿的真实物品贴上标签”。
对于不能被标记的物品,指令也给了醒目的提示:“以下物品不应该被贴上标签,因为人类在实际生活中不可能穿着这些物品!”
记者对于自己的分辨能力感到自信,于是就开始了测试。首先是一张杂志的照片,上面的女人穿着裙子。照片上的服装是真实的服装的吗?记者认为不是,因为人不能穿照片中的服装。但是,错了!在AI看来,真实服装的照片就是真实服装。接下来是一张在昏暗卧室中,一个女人站在全身镜子前自拍的照片。她穿着的衬衫和短裤是真实的。那么倒影呢?同样是真实的!真实服装的倒影也是真实服装。
经过尴尬的大量尝试和错误后,记者终于开始了实际工作,却惊恐地发现他一直在努力遵循的指令已经被更新和澄清了很多次,现在已经变成了一本有43页的指令书:不要标记装满衣服而且打开的行李箱;标记鞋子但不要标记脚蹼;标记紧身裤但不要标记连紧身裤袜;即使有人穿着毛巾也不要标记它;标记服装但不要标记盔甲。
收入微薄
Remotasks上的大部分工作都是按件计酬的,一项任务的收入从几美分到几美元不等。因为任务可能需要几秒钟或几个小时,所以工资很难预测。标注员们称,当Remotasks刚进入肯尼亚时,他们的报酬相对较高。根据任务的不同,平均每小时大约为5到10美元。但随着时间的推移,报酬会下降。
Scale AI发言人安娜·弗兰科(Anna Franko)表示,该公司的经济学家会分析项目的细节、所需的技能、地区生活成本和其他因素,“以确保公平和有竞争力的薪酬”。Scale AI的前员工还表示,标注员的薪酬是通过一种类似动态定价的机制确定的,该机制根据可用的标注员数量和数据需要的迫切度进行调整。
根据记者的采访和招聘公告,美国的Remotasks标注员通常每小时能挣10到25美元,一些专业标注领域的专家报酬更高。今年年初时,接受采访的肯尼亚标注员的报酬已经降到了每小时1到3美元。
这还是能赚钱的时候。标注员对于Remotasks的工作最常见的抱怨就是它的不稳定性。它或许能在很长一段时间内给标注员提供足够稳定的工作,可以作为全职工作,但也充满了不可预测性,使人无法依赖它。标注员花费数小时阅读指令和完成无偿培训,结果只能完成几十个任务,随后项目就结束了。接着,标注员可能几天都没有新任务,然后再突然出现一项完全不同的任务,可能持续几个小时到几周时间不等。任何任务都有可能是他们的最后一项任务,他们永远不知道下一个任务何时到来。
工程师和数据供应商称,这种时有时无的工作取决于AI开发的节奏。训练一个大模型需要大量标注,然后是更多的迭代更新。工程师们希望所有这些都尽可能快地完成,这样他们就能赶上目标发布日期,可能在几个月的时间里就需要数千名标注员,然后减少到几百名,接着只需要十几名特定类型的专家,然后又需要数千名。“问题是,谁来承担这些需求波动的成本?”AI伙伴关系的金达尔说,“因为目前承担这些成本的是标注员们。”
抱团取暖
为了取得成功,标注员们会相互合作。维克多(Victor)在内罗毕上大学时就开始为Remotasks工作。当记者告诉他自己在交通导向员任务中遇到的困难时,他表示大家都知道要远离那个任务:任务太棘手、报酬还低,不值得做。
和许多标注员一样,维克多使用非官方的WhatsApp群聊,在有好任务时通知大家。当他弄清楚一个新任务时,他会即兴使用谷歌视频会议服务Meets与其他人分享如何完成任务。任何人都可以加入会议,一起研究,分享技巧。“这是我们培养起来的相互帮助的文化,因为我们知道,单凭一个人是无法掌握所有技巧的。”他说道。
由于工作会毫无征兆地出现又消失,所以标注员们总是需要保持警惕。维克多发现,项目会在深夜突然出现,所以他习惯每三个小时左右醒来检查一下他的任务队列。当有任务时,他会保持清醒,只要能让自己工作。有一次,他熬夜36个小时,在人群照片中给肘部、膝盖和头部做标记,他也不知道这么做是干什么。还有一次,他熬夜太久,妈妈问他眼睛怎么了。他照镜子后才发现,眼睛肿了。
标注员通常只是模糊地知道他们正在为其他地方的企业训练AI,但有时这种神秘感会消失,因为指令中提到了某个品牌或聊天机器人说得太多了。“我读了一些资料,并通过谷歌搜索发现,我正在为一位25岁的亿万富翁工作。”一名员工说,他当时正在给打电话订购达美乐披萨的人的情绪贴标签。
“如果我让某人成为亿万富翁,而我每周只赚几美元,我真的是在浪费我的生命。”他不满地说。
没人会记住我们
维克多自称是一名AI“狂热者”。他开始做标注,是因为他想帮助实现一个完全自动化的后工作未来。但是今年早些时候,有人在他的WhatsApp群里发了一篇《时代》杂志的报道,内容是标注员训练ChatGPT识别有毒内容,但是Scale AI支付给他们的时薪不到2美元。
“这些公司利润丰厚,但支付给标注员的薪酬却如此之低,这让人感到愤怒。”维克多说。当被告知Remotasks与Scale的关系时,他才知道自己参与的其中一项任务的指令与OpenAI使用的几乎相同,这意味着他可能也在训练ChatGPT,时薪大约3美元。
“我记得有人发帖说,我们将来会被人铭记,”他说,“然后,另一个人回复说,我们的待遇比步兵还差,未来我们什么也不会被记住。这段话我记得很清楚。没有人会认可我们所做的工作和付出的努力。”
关键词:
揭秘真实的「AI民工」:为生存机械地「做任务」 时薪低至1美元
IBM接近以361亿元收购软件公司Apptio
出游人次破亿 端午假期旅游需求持续释放
全球播报:三菱日联金融集团(MUFG.US)将以4.67亿美元收购印尼汽车贷款提供商Mandala Finance
消息!四部门开展专项行动 促进劳动关系和谐稳定
环球视讯!汪小菲晒一双儿女合影,网友评价戳心,内涵大S作为妈妈的不作为|时快讯
美国药物滥用再致惨案!8个月婴儿服用芬太尼过量死亡 其父母被捕 当前看点
速看:4000万预约开放世界新游!网易旗舰级手游《逆水寒》公测预下载开启
每日快报!彭州法院:邀请学生旁听庭审 禁毒教育“零距离”
内蒙古加强暑期旅游市场安全管理
甘肃高考成绩及各批次录取最低控制分数线公布 每日快播
当前关注:女篮亚洲杯-中国女篮大胜黎巴嫩 小组赛旗开得胜
广州市规划和自然资源局赴北京市规划展览馆参观调研 当前速讯
浦东这个街道开启“志愿者+”增能培训,推动新时代文明实践工作再上新台阶
陈梦孙颖莎上奥运似乎已成定局 环球快讯
引进项目200多个 60多个项目投运 落地产品1000余种 新区全力打造千亿级绿色化工园区
端午小长假全国铁路累计发送旅客7037.9万人次|微资讯
每日速看!女性被骗去缅甸有多惨 ?美女大学生被男友骗到缅甸边界残忍杀害,190的身高却出卖了他!
LPL国家队名单公布,引发巨大争议!BLG仅入选一人,EDG成为赢家
滨州市90项举措全面“升级”群众健康获得感-世界热头条
焦点讯息:邱家店镇宋官庄村硕果挂满枝 采摘正当时
港股午评:恒指跌0.14%,恒生科技指数涨0.28%
世界快讯:袁潇洋:虚拟电厂将转变电力调度的机制从而提升电网韧性
狗狗皮肤变黑是什么原因(狗狗的皮肤变成黑色怎么回事)
观焦点:国铁集团:端午5天全国铁路送客逾7000万
新时达:目前与华为暂无工业机器人业务方面合作 世界新要闻
东方园林:上半年生态工程中标金额约30亿元 已超去年全年中标金额 当前热点
全球即时看!“网红”的迁徙:主播涌向东南亚
京津冀等地高温天气27日起上线 局地气温或破历史极值
什么情况下可以否定公司的法律人格_环球热头条
海南自由贸易港封关前禁毒三年“固本防风险”启动仪式在海口举行 环球微资讯
每日热闻!首批集中供地基本出炉,应增加供应缓解僧多粥少矛盾
畜禽养殖行业报告 2023年畜禽养殖市场深度全景调研及畜禽养殖行业未来展望
当前热讯:【环球财经】日本工商界关注第六届进博会开放平台作用
在陪伴中快乐成长 在游戏中插上创造力的翅膀
环球速看:河南:产教融合助力服装产业数智化人才培育
2023河南高招咨询大会在郑州启幕 逾700所高校为考生“面对面”答疑
速递!武汉首批集中供地推60宗地 总起价超700亿元
中国中部第一城,冲刺2万亿元GDP!【附武汉市产业结构分析】 世界焦点
(共话中国经济新机遇)专访:世界对中国的发展与机遇充满期待——访世界经济论坛总裁布伦德 每日讯息
2023年浙江高考成绩分数段表出炉!|世界看热讯
环球热门:博创科技:400G-DR4模块已实现量产出货
热推荐:明起北方高温再度来袭:局地或出现极端高温
爱心志愿者慰问残疾学子钟华强
总投资38.5亿元,荣成市成功“牵手”5个项目
每日聚焦:变压器结构及工作原理(变压器结构)
模拟经营游戏《我的幻想乡》正式登陆Steam-当前短讯
热头条丨光伏概念股午后继续反弹 帝科股份涨超10%
最新快讯!研报掘金丨财通证券:清越科技电子纸模组有望快速增长,首予“增持”评级
陈楚生二胎得子,甜蜜感谢老婆,大儿子抱着弟弟,一家人超幸福
中华传统美德怎样融入思政课教学
月均增长达“百亿级” 六问快递业如何实现提速发展
产业一线招人难,韩国将增发外籍熟练劳工长期就业签证 天天热讯
2023全球汽车零部件供应商百强榜:13家中国企业上榜 宁德时代排名第五
环球视点!一加Ace2 Pro入网,将成为业内首款24GB物理内存手机
6月26日黄金期货走势分析:进一步反弹似乎遇到阻力-全球时讯
天天观察:钼铁行业市场有多大?钼铁行业市场深度调研报告2023
全球聚焦:《暗黑4》等游戏登陆困难原因找到了 暴雪承认遭遇黑客攻击
家有一老如有一宝!19分钟15分6板,成女篮进攻轴,展现全面性 全球热议
获屈原杯一等奖 戴逢红:创作更好的诗歌向屈原致敬
2023版30克熊猫银币现在市场价是多少(2023年06月26日)
全球快看点丨小心!名为“奶茶粉” 实为“神仙水”“迷奸水”
热推荐:巨大进展!曝姆巴佩交易接近完成,未来两周内敲定加盟皇马
天天快资讯:武汉火影数字|房地产宣传片拍摄制作公司 地产三维动画宣传片
天天实时:蒲公英配枸杞什么作用(你知道多少)
焦点速读:英派斯(002899):特定股东股份减持计划实施进展
《假如舰长是雷奥尼克斯》第三章
618初战扫地机器人增速第一,石头科技大涨近10%|世界快消息
【不要做“看淡一切”的伪佛系青年,别被无知的狂妄耽误了自己,成年人要理直气...
环球头条:F1赛车新游戏《New Star GP》上架:支持中文
洛阳市统筹区内就医城乡居民医保能直接结算吗?
环球今头条!阳光保i家版重疾险有什么亮点?怎么样?
快看点丨短讯!热推荐:当前热点-天天头条:新消息丨即时焦点:世界看点:智利进口硼酸商品报价动态(2023-06-25) 天天热议 最新资讯|每日视讯-今日快讯
魅族与极星汽车合作成立合资公司
财报前瞻 | 黑莓(BB.US)今年以来涨近47% Q1财报会提供更多复苏迹象吗? 热点在线
全球快资讯:关于批准发布《柴油机 非贵金属催化型排气捕集器》等团体标准的公告
全球快看:西部矿业: 公司不掌握您说的参与组建中国盐湖集团的情况
日本东电移除核污染水排海隧道施工重型设备,排海工程即将完工 焦点简讯
洛克王国滔天战意活动攻略 滔天战意活动玩法介绍[多图]
2023萧山食品有限公司招聘通知
排列三2023167期祥龙看三预测
网传8岁男童被武术教练殴打致死?警方通报-时快讯
【焦点热闻】17+10夺MVP!韩旭无愧亚洲杯第一球星,内线新绝配15+6抢镜
黄河汛前调水调沙,济南16座浮桥拆除完毕_世界快讯
铸精品工程!贵州铁路建设劳动竞赛启动大会举行
三穗县红十字持证救护员再添204人
【全球新视野】年内累计发行176只新股,共募资2106.30亿元
53只国家级保护动物非正常死亡?三江源国家公园对这篇文章回应
正式任命!孙颖莎新身份曝光,国乒人心振奋,陈梦王曼昱无缘-环球时讯
问鼎女子PGA锦标赛冠军,上海选手殷若宁首捧高尔夫大满贯奖杯
前沿资讯!《消失的她》畸形秀冲上热搜!泰国畸形秀真实案件还原
拉美电子商务市场快速增长 中拉产业合作日益扩大
苹果iPhone 15 Pro Max保护壳疑似曝光:传统静音键被替代
中国女篮45分大胜黎巴嫩女篮,收获亚洲杯开门红 世界新消息
中能论坛丨如何为海上油气平台提供安稳电能?
当前焦点!2023年端午节假期文化和旅游市场情况
天天微速讯:58岁买百万医疗合适吗?一年要交多少保费?
韩国“萨德”部署地民众持续抗议 强烈谴责执政党代表团访问|每日看点
【全球新视野】请查收|高考志愿填报十问十答来了
海南出台常态化监管机制 整治海鲜市场消费欺诈行为