побочный доход или мошенничество? Что нужно знать о работе по аннотации данных

Scale AI Illustrations As CEO Says US Risks Losing AI 'Ammunition' Edge to China

(SeaPRwire) –   在,,和其它地方,用户发帖称自己在DataAnnotation.tech, Taskup.ai, Remotasks和Amazon Mechanical Turk等网站上利用空闲时间完成小任务,每小时能挣$20或更多。

随着企业蜂拥而至地构建AI模型,“数据标注”和“数据贴标签”工作的需求不断增长。工人完成诸如写作和编码之类任务,之后科技公司再利用这些任务来开发人工智能系统,而这些系统利用大量示例数据点进行训练。某些模型要求所有输入数据均由人类标注,这项技术被称为“监督学习”。虽然“非监督学习”——人工智能模型被输入未标注的数据——正变得日益流行,但利用非监督学习进行训练的AI系统仍然经常需要人类标注数据的最后一步中。

没有关于有多少人从事数据标注工作的确切估计。谷歌研究2022年近似估算人数为数百万,未来人数可能增加到数十亿。谷歌2021年估计有1.63亿人在网络劳动力平台上创建了个人资料,其中1400万人至少通过该平台获得了一次工作,330万人至少完成了10个项目或赚了至少1000美元。(然而此数字对于数据标注很可能是一个高估,因为并非所有在网络劳动力平台上进行的工作都属于数据标注工作。)

数据标注网站(通常是更大公司的子公司)可以提供合法途径来赚钱。随着AI产业持续增长,对人工标注人员的需求也随之增长。但潜在用户应意识到,数据贴标签行业监管不力,且由于该行业不透明,因此导航起来可能很困难。以下提示可帮您了解。

如何开始从事数据标注工作?

要申请这些项目,工人必须先完成评估。初始评估的持续时间可能会有所不同,但用户通常报告的时间短至一小时,长至三小时。如果用户通过评估,他们应该开始通过该网站收到带薪工作的邀请。如果用户未被该项目接受,他们通常会在完成评估后不会收到任何消息。 

评估中的任务性质各不相同。Partnership on AI(一家非营利组织)的AI、劳工和经济项目负责人Sonam Jindal表示,越来越多的数据标注工作需要高技能。“我们会开始看到,随着您需要更高质量的AI模型,您还需要更高质量的数据,”她说。“我们可以弄清楚某物是猫还是狗,这很棒。继续执行更高级的任务——拥有在更专业化的现实世界场景中更有用的更高级AI——您将需要更专业的技能。”

这项工作能支付多少钱? 

在美国,网站通常会提供每小时20美元用于诸如给照片贴标签和完成写作练习的任务。更专业化的数据标注工作可以提供更高的报酬。例如,DataAnnotation.tech为编码任务提供40美元,而Outlier.ai为化学任务提供每小时60美元。

在美国以外,数据标注人员的薪酬通常低得多,Jindal说道。但尽管价格较高,但公司可能会喜欢美国工人,原因是某些任务需要特定的文化知识或在美国常见的技能。 

人们有什么样的经历? 

在,用户报告了各种各样的数据标注工作经验。许多人描述了积极的经历——直接的入门流程、充足的任务供应和良好的报酬。

“我在[DataAnnotation.Tech]工作了将近2年,”一名用户。 “您可以按任务或按小时赚钱,具体取决于项目。他们通过PayPal支付。过去几年我仅兼职工作,现在快要达到3000美元了。说实话,我全职工作时辞职了一段时间,但现在又回来了。我现在正在处理两个项目,一个每小时20美元,另一个每小时25美元。我每周能挣大约400-500美元。这不固定,因为任务来来去去,但如果您需要使用笔记本电脑或电脑做一些额外工作,这是一项不错的兼职收入。”

但有些人报告的经历不太积极,比如被告知已经通过了评估,但此后从未获得任何任务。更令人担忧的是,一些用户报告称他们在有大量尚未支付的收益的情况下被停用了帐户。有位用户,当其账户被停用时,还有价值2869美元的工作尚未支付,并且他们给该公司发送了支持邮件,但没有收到回复。

魏森鲍姆研究所柏林数据、算法系统和伦理研究小组负责人米拉格罗斯·米切利 (Milagros Miceli) 表示,数据标注网站经常使用算法管理来降低成本,这可能会导致许多工人遭遇粗暴的待遇。她说,而且因为数据标注行业监管不力,因此企业很少因粗暴对待工人而受到处罚。

Amazon.com Illustrations Ahead Of Earnings Figures

数据用于何处?

一些公司(例如Amazon Mechanical Turk和Upwork)以相对透明的方式运作,为数据标注劳动购买者和工人提供相同的品牌。但其他公司没有。Remotasks是数据标注提供商Scale AI(一家总部位于旧金山价值数十亿美元的公司,其客户包括OpenAI、Meta和美国军方)面向工人的子公司。同样,Taskup.ai、DataAnnotation.tech和Gethybrid.io是另一家服务于Anthropic和Microsoft等客户的数据标注提供商Surge AI的子公司。

米切利表示,公司表示,这种保密性对于防止敏感的商业信息(例如新产品开发计划)外泄是必要的。但他们也喜欢保密,因为这会降低他们与潜在的剥削条件(例如)有联系的可能性。

Scale AI发言人指引Time去,这表明Remotasks是独立于Scale AI之外而建立的,以保护客户的机密性,并列举了一些Scale AI为确保工人得到公平对待而采取的措施的示例。该发言人还表示:“Remotasks不参与需要接触敏感图片/视频的项目,而且如果此类内容出现在数据集中,则可以举报并将其从工作流中移除。”

截至发稿,Surge AI、Taskup.ai、DataAnnotation.tech和Gethybrid.io未回复置评请求。

Jindal认为,数据工作从根本上被低估了,并建议对数据工作者对其帮助创建的产品支付版税。 

她说:“他们的知识和信息被捕获到数据中并用于训练这些被称为人工智能的AI模型。” “实际上,是他们的人类智能——我们共同的人类智能——被内置到这些模型中。”

本文由第三方内容提供商提供。SeaPRwire (https://www.seaprwire.com/)对此不作任何保证或陈述。

分类: 头条新闻,日常新闻

SeaPRwire为公司和机构提供全球新闻稿发布,覆盖超过6,500个媒体库、86,000名编辑和记者,以及350万以上终端桌面和手机App。SeaPRwire支持英、日、德、韩、法、俄、印尼、马来、越南、中文等多种语言新闻稿发布。