我们是否正步入数据虚无主义时代?

—Hill Street Studios—Getty Images

(SeaPRwire) –   我们每一次点击、每一张照片、每一次搜索查询都会留下数字回声。这些数字痕迹是推动人工智能革命、驱动重塑世界的技术的原始材料。然而,对于创造这些数据的我们所有人来说,数据已经变得毫无实际价值。

普通互联网用户并不考虑自己数据的价值。他们只是将数据免费交给世界上一些最富有的公司。

正是这种行为让我担心我们正在进入数据虚无主义时代,我们的数据对人工智能开发者来说至关重要,但对我们来说几乎一文不值——不是因为我们的数据真的没有价值,而是因为人们感到 powerless(无能为力)无法阻止自己的数据被强行收集。

当我刚开始建立人工智能伦理研究实验室时,许多人工智能研究人员对 OpenAI 的早期方法持怀疑态度。他们真的可以通过扩大数据和计算能力来实现与人类相媲美的人工智能,而无需更深入的理论见解吗?这似乎更像是一种基于资本而非科学的方法。

然而,OpenAI 笑到了最后。他们的成功证明了一个简单却令人不安的公式:海量数据集加上庞大的计算能力等于前所未有的 AI 能力。全球人工智能竞赛很快变成了根本上的数据军备竞赛。

以数据为中心的淘金热有着悠久的历史根源,始于 2010 年代深度学习革命,其本身是由 ImageNet 等网络爬取的数据集点燃的,这表明数据的可用性可以显著提高 AI 性能。但今天的规模不同了,风险也不同。具有讽刺意味的是,AI 的价值飙升直接损害了其自身所依赖的数据。为了赢得人工智能竞赛,公司一直在激励自己尽可能多地收集数据,而不太考虑数据创作者的权利——美国、日本和印度的监管机构默许了这种心态,他们愿意削弱数据保护来加速国家人工智能发展。

这种广泛的 disempowerment(剥夺权力)现象催生了危险现象:数据虚无主义。这是越来越多人相信我们的数据失去了意义和价值,因为我们完全失去了对其的控制。这是一种 resignation(放弃),认为生活在人工智能时代就必须交出对数据的完全控制权。当我们的数字生活被无情地挖掘而没有征得同意或获得补偿时,认为我们的数据权利已经消失是合乎情理的。事实上,皮尤研究中心 (Pew Research Center) 于 2023 年进行的一项研究发现,尽管 81% 的美国人对公司如何使用他们的数据表示担忧,但 73% 的人认为自己几乎没有控制权。

数据虚无主义不仅是一个哲学问题,它还是现代历史上最大一次财富转移的蓝图。人工智能就像一个巨大的漏斗,将从数十亿互联网用户和数字媒体的数据中汲取价值,并将巨大的经济回报集中在少数几家构建基础模型的公司手中。这不仅是对隐私和知识产权的丧失,也是大规模经济剥夺的表现。

正如尼采 (Nietzsche) 警告的那样,虚无主义的道德真空可能导致社会衰败,目前对负责任数据实践的漠视可能会侵蚀人们对机构的信任, perpetuate( perpetuate)系统性不平等。

然而,并非所有人都接受这种大规模财富和权力的重新分配而不反抗。创意产业处于前线,作家、艺术家和音乐家正就版权侵权问题对主要人工智能公司提起数十起诉讼。与此同时,根据伊利诺伊州《生物识别信息隐私法》(BIPA) 提起的一波诉讼正在挑战对我们最个人数据的未经授权的使用——我们的脸和声音。

这使我们面临一个关键十字路口:为了技术进步牺牲我们的数据权利,或者为了保护它们而在全球人工智能竞赛中落后。这是一个 false dichotomy(虚假二分法)。还有第三条路:道德创新。

可以为人工智能开发收集和提供数据,并给予同意和公平补偿——事实上,我的团队已经展示了如何实现这一点。展望未来,研究人员应与来自世界各地的付费和知情参与者合作,构建高质量的数据集,供人工智能社区负责任地使用。

在不损害个人权利的前提下为尖端人工智能构建数据集是可能的。“道德来源”不应成为创新的障碍,而应成为其质量和可持续性的标志。

下一步是让人工智能界和监管机构认真对待道德数据管理。人工智能和人类之间的经济权力动态在很大程度上将由数据层决定,因此,关于数据权利持有者的同意和补偿机制的问题应该是人工智能研究人员和监管机构关注的重点。建立一个 opt-in 或 opt-out(选择加入或退出)机制,为全世界数据作为人工智能原始材料的人提供真正的控制是一项艰巨的任务,但现在必须解决。此外,随着人工智能开发人员耗尽可用的数据,未来的创新可能取决于数据的数量而不是质量。

尼采对虚无主义的 cure( cure)是创造个人意义,但人工智能的规模要求我们创建系统来肯定和保护人类贡献的价值。我们现在正处于转折点:如果我们未能建立这样的保护,我们将不得不 resign ourselves to a future(接受一个未来),在这个未来中,人工智能的好处集中在少数人手中,绝大多数人发现他们的贡献毫无价值。人工智能的未来不应当建立在 mass data appropriation(大规模数据征用)的基础上。它必须建立在尊重、同意和共享价值的基础之上。数据虚无主义的时代已经到来;我们必须防止它。

本文由第三方内容提供商提供。SeaPRwire (https://www.seaprwire.com/)对此不作任何保证或陈述。

分类: 头条新闻,日常新闻

SeaPRwire为公司和机构提供全球新闻稿发布,覆盖超过6,500个媒体库、86,000名编辑和记者,以及350万以上终端桌面和手机App。SeaPRwire支持英、日、德、韩、法、俄、印尼、马来、越南、中文等多种语言新闻稿发布。