【全球人工智能安全报告】
首次系统性地评估了通用人工智能的快速发展带来的各种风险,特别是那些具有反直觉性的新兴风险,并提出了相应的风险管理技术和政策建议,强调了边际风险评估和多层次防御的重要性。
- 通用人工智能能力的快速发展: 报告强调了通用人工智能的快速发展,其能力在编程、科学推理和图像生成等多个领域都超过了之前的预期。像o3这样强大的新模型的出现进一步突显了这种快速发展。
- 已确立和新兴的危害: 报告详细介绍了人工智能现存的危害,包括诈骗、偏差输出、可靠性问题和隐私侵犯。它还讨论了新兴风险,例如大规模劳动力市场冲击、人工智能支持的攻击(网络和生物)以及潜在的失控。报告指出了专家们对这些新兴风险的时间和可能性存在分歧。
- 尚不成熟的风险管理技术: 虽然存在各种用于风险评估和缓解的技术方法,但报告强调了它们的局限性。理解模型输出的可解释性技术仍然非常有限,目前训练更安全模型的方法并非万无一失。“政策制定者的证据困境”——必须在证据不完整的情况下采取行动——得到了强调。
- 开放权重模型和边际风险困境: 报告介绍了开放权重模型(其权重可供公众下载)的概念,并认为应根据“边际风险”(与封闭模型或现有技术相比的额外风险)来评估其风险。开放权重模型发布的不可逆性得到了强调。
- 风险管理的技术和社会挑战: 报告确定了一些技术挑战,包括人工智能Agent的复杂性、用例的广泛性以及对模型内部机制缺乏了解。社会挑战包括开发人员面临的竞争压力、市场参与者集中的权力以及确定法律责任的困难。
思考:
1. 通用人工智能技术发展迅速,其风险也随之增加,需要国际社会加强合作,共同应对。
2. 风险管理需要多学科协同,技术手段和社会政策都需要同步发展。
3. 开放权重模型的边际风险评估方法,为平衡技术发展与风险控制提供了新的思路。
arxiv.org/abs/2501.17805