一个新成立的非营利组织致力于解决AI版权问题

(SeaPRwire) –   Ed Newton-Rex 去年公开辞去了一家知名AI公司的高管职位,这是因为他与老板在如何处理版权问题上的分歧。

Stability AI,流行的AI图像生成模型Stable Diffusion 的开发商,曾经通过收集互联网上数以百万计未经创作者同意的图片来训练该模型。与许多其他领先的AI公司一样,Stability AI 认为这种技术不违反版权法,因为它属于版权作品的“公平使用”形式。

但Newton-Rex,Stability AI音频团队负责人,持不同意见。“价值数十亿美元的公司正在未经许可地使用创作者作品来训练生成AI模型,这些模型随后又用于创建新的内容,其中许多情况下可能与原作品竞争,”他在去年11月公开辞职时在X平台(原Twitter)上写道。

这可能是在AI系统使用版权作品进行训练这个问题上现在正酝酿的争论的第一个声明。12月,《纽约时报》就以违反版权为由在曼哈顿法院起诉了OpenAI,指控该公司非法使用了报纸数百万篇文章来训练旨在与《时报》竞争成为可靠信息来源的AI系统。同年7月,喜剧演员莎拉·西尔弗曼等作家也起诉了OpenAI和Meta,指控这些公司未经允许就使用了他们的作品来训练AI模型。同年早些时候,艺术家Sarah Andersen、Karla Orti等人起诉了Midjourney、Stability AI和DeviantArt等开发图像生成AI模型的公司,声称这些公司在未经艺术家同意的情况下将他们的作品用于训练AI模型。一些视觉艺术家也通过提供“毒化”AI模型的服务来反击,这些服务可以在未经同意就使用艺术家作品训练模型时使模型崩溃或抵制复制其艺术风格。

OpenAI表示,它认为《纽约时报》针对它提起的诉讼“没有根据”,并补充说,尽管它认为从互联网上抓取数据进行训练是合法的,但为了“做正确的事”,它提供出版商选择不参与的选择。Stability AI暂时没有对此作出回应。

1月17日,Newton-Rex宣布启动了一项新的努力,旨在激励AI公司尊重创作者。他成立了一个非营利机构“Fairly Trained”,为那些只使用经创作者同意的数据进行训练的AI公司提供认证。他希望通过提高这类更重视获取训练数据来源的公司的声誉,可以激励整个行业更公平地对待创作者。Newton-Rex告诉《时代周刊》:“这个行业有一个非常重要的伦理层面,这个认证就是要强调这一点。”

Fairly Trained成立时提供认证的模型有9个,其中许多来自音乐创作领域的公司,包括Anthropic等“声音健康”公司,它与艺术家格林姆斯和詹姆斯·布雷克等人合作过。这个认证表示,这些公司在训练模型时使用的资料是经过合法许可的,而不是简单声称属于“公平使用”范畴。

除了从事AI工作,Newton-Rex本人也是一位古典作曲家,他创作合唱音乐。他表示,自己作为艺术家的实践也激发了他为创作者发声。“对我来说,这一问题一直都很亲切,我相信这很大程度上源于我自己也曾经投入过创作,”他说。“除非你真正经历过将自己的作品投入其中,看到它进入世人面前的过程,否则很难真正理解创作者的感受。”看到自己的艺术作品只能获得微薄的版税收入,而AI公司却以数十亿美元的规模运营,他认为这种不满情绪对任何类型的艺术家来说都很普遍。“我投入了那么多工作,但得到的回报是什么?我希望公司将我的作品用于建立自己获利的模型而不付任何额外报酬吗?”

他继续说:“很多创作者,包括我自己,都会说不。但如果有同意的机会,可以讨论条款,最终还可以赚些钱,那将会是一件很好的事。”

Fairly Trained不要求寻求认证的公司共享它们的数据集以供审核。相反,它要求公司提交书面材料,详细说明数据集包含什么以及数据来源,它们采取了什么尽职调查流程,是否保留了良好的记录,根据Newton-Rex的说法。“显然,这里有一定程度的信任,”他说。“这需要进行讨论,是否需要更多。但从一开始看,基于信任的系统实际上也可以工作。尤其是提供不准确信息可能会导致后续吊销认证,这将成为一个制约。”他补充说,声称享有公平使用豁免的大多数公司在表示它们有法律权利采取这种策略时,“很直接”。

但仅依靠公司对数据集内容和来源的描述来验证也存在明显漏洞。一位研究AI系统大量使用的数据集内容的学者表示:“我们实际需要查看这些数据集本身,才能核实是否仍包含有问题的内容。”在没有看到数据集本身的情况下,很难判断这是否足够。

包括OpenAI、Google DeepMind、Meta和Anthropic在内的最大AI公司,通常不会披露它们用于训练最大模型的数据集的内容或细节。这常常成为创作者试图了解是否未经同意就使用自己数据训练模型的障碍。

OpenAI已与包括美联社和Axel Springer在内的几家新闻机构签署协议,许可新闻文章用于训练数据。它还在与CNN、福克斯新闻和《时代周刊》等其他几家进行进一步讨论。

本文由第三方内容提供商提供。SeaPRwire (https://www.seaprwire.com/)对此不作任何保证或陈述。

分类: 头条新闻,日常新闻

SeaPRwire为公司和机构提供全球新闻稿发布,覆盖超过6,500个媒体库、86,000名编辑和记者,以及350万以上终端桌面和手机App。SeaPRwire支持英、日、德、韩、法、俄、印尼、马来、越南、中文等多种语言新闻稿发布。