(SeaPRwire) – 在过去几年中,人工智能一直是备受瞩目的热门话题。每一个新的AI模型都揭示出令人难以置信的创新,甚至超越数周前发布的版本。AI公司的专家、开发者和首席执行官们对未来发展轨迹做出了大胆预测,从繁重劳动的终结和人类寿命的显著提升,到对人类的潜在生存威胁。
如果每个人都在谈论AI,部分原因是这些创新的公开化为开发这些模型的公司带来了指数级增长的收入。但随着AI变得更快、更强大、更复杂,这种公开对话可能会迅速转入闭门状态。AI公司正越来越多地在其自身组织内部署AI模型,而且它们很可能很快就会发现将其最强大的未来模型保留供内部使用是必要的。但正如本文下方所论述的,这些看似无害的决定可能对整个社会构成严重威胁。
大多数领先的AI公司都公开表示,他们打算开发在所有认知任务上与人类能力相当的AI模型,这可能产生数万亿美元的经济价值。随着目前普遍认为正稳步迈向通用人工智能(AGI),高度先进模型的潜在战略优势可能很快就会促使公司秘密地、内部地利用其模型来加速技术进步——但几乎不向竞争对手和更广泛的外部世界透露进展信号。
当前的AI系统已经经常在实验模拟环境中表现出意想不到、非预期和不希望的行为,例如,威胁误导用户、生成有害内容或公然撒谎。然而,如果领先的开发者开始捂紧底牌,社会将不再有一个窗口,哪怕是一个狭窄的窗口,来公开了解和评估这项基础技术的优点和缺点、风险和安全状况以及发展轨迹。一旦先进的未来AI系统在闭门状态下被部署和使用,甚至专属于内部,对社会潜在的危险可能会在没有监督或预警的情况下出现和演变——这是我们能够且必须避免的威胁。
领先的实验室已经越来越多地利用AI系统来加速自身的研发(R&D)流程,通过设计新算法、提出全新架构或优化代码。例如,Google声称其50%的代码现在是由AI编写的。正如《自主代理:机遇、挑战、潜力和政策》(Autonomous Agents: Opportunities, Challenges, Potentials, and Policies)一文所强调的,先进的AI系统最终可以用于迭代改进它们的继任者,潜在地创造一个强大的“AI飞轮”,不断增强模型能力。如果AI公司能够避开窥探的目光,利用其战略优势,在竞争对手之前快速达到通用人工智能,甚至超级智能,那么这将是极好的消息。
乍一看,所有这一切听起来可能无害:一个未发布的AI系统能构成什么威胁?
问题是双重的:首先,随着先进AI系统在内部变得越来越有用以构建更好的AI,可能会有强大的竞争和经济激励,甚至比现在更甚,优先考虑速度和竞争优势而非谨慎。这种竞争态势带来了风险,特别是如果日益先进的AI系统开始被公司员工使用,并部署到AI研发等对安全至关重要的领域,可能会自主运行以减少摩擦,在任何人完全理解AI系统行为之前,就植入了潜在的故障点。
其次,现有的评估和干预主要集中在公开可用的AI系统上。对于内部部署的AI系统,几乎没有(甚至根本没有)信息可用,关于谁拥有特权访问权限或它们用于何种目的。更具体地说,关于它们的功能、它们是否以不希望的方式行事;它们是否在适当的控制、监督机制和保障措施下;它们是否会被有权限访问者滥用或它们的整体风险状况,这些信息都鲜有披露。此外,也缺乏足够清醒而详细的要求来确保这些AI系统经过严格测试,并且在投入使用之前不会对社会构成连锁威胁。
如果我们不要求科技公司提供足够详细的信息,说明它们如何测试、控制和内部使用新的AI模型,政府就无法为最终可能拥有国家级能力的AI系统做好准备。同时,在闭门状态下发展起来的威胁可能会在没有事先警告或干预能力的情况下蔓延到社会。诚然,即使在今天,我们也不能信任当前的AI系统能够可靠地按预期行事,无论它们是外部部署还是内部部署。然而,我们仍有时间采取行动。
现在可以采取一些直接的措施。AI公司的自愿前沿AI安全政策范围应明确扩展,以涵盖高风险的内部部署和使用,例如用于加速AI研发。作为其中的一部分,内部部署应与外部部署同等对待,并且应鼓励在投入使用之前进行严格的评估和检测以识别危险能力,建立清晰的风险概况,以及必需的控制或防护机制。
负责国家备战的政府机构应对高度先进AI系统的内部部署和使用拥有积极的可见性,并接收所有必要的国家安全关键信息。这可以包括例如,谁有权访问这些AI系统以及在什么条件下访问,这些AI系统用于何种目的,对它们施加了何种监督,以及如果这种监督失败可能发生什么,以确保经济和知识产权利益与合法的国家安全利益得到平衡。
AI公司和政府应合作率先采纳这些直接的最佳实践,以确保可信赖的创新和公众保护。
本文由第三方内容提供商提供。SeaPRwire (https://www.seaprwire.com/)对此不作任何保证或陈述。
分类: 头条新闻,日常新闻
SeaPRwire为公司和机构提供全球新闻稿发布,覆盖超过6,500个媒体库、86,000名编辑和记者,以及350万以上终端桌面和手机App。SeaPRwire支持英、日、德、韩、法、俄、印尼、马来、越南、中文等多种语言新闻稿发布。