当前位置:首页 > 报告详情

安远AI:2024前沿人工智能安全的最佳实践-面向中国机构的研发实践案例与政策制定指南(76页).pdf

上传人: 成**** 编号:151694 2024-01-17 76页 3.69MB

下载:

1、执摘要执摘要前沿智能安全已成为全球和中国重点关注的议题2023年1018,习近平主席在第三届“带路”国际合作峰论坛开幕式主旨演讲中宣布中将提出全球智能治理倡议1,重申各国应在智能治理中加强信息交流和技术合作,共同做好险防范,形成具有泛共识的智能治理框架和标准规范,不断提升智能技术的安全性、可靠性、可控性、公平性。2023年1026,联合国秘书古特雷斯宣布,联合国正式组建个新的“智能级别咨询机构”2,以探讨这项技术带来的险和机遇,并为国际社会加强治理提供持。2023年111,中国、美国在内的28个国家和欧盟,共同签署了布莱切利智能安全宣3,致认为前沿智能技术可能会引发巨险,尤其是在络安全、物技术

2、和加剧传播虚假信息等。此前的2023年428,中共中央政治局会议明确提出,要重视通智能发展,营造创新态,重视防范险4。2023年710,国家信办等七部联合公布成式智能服务管理暂办法5。随着前沿智能的快速发展,按照关于加强科技伦理治理的意6、新代智能治理原则7、新代智能伦理规范8等治理件,社会应积极落实对更级智能的潜在险研判和防范,确保智能安全可靠可控,推动经济、社会及态可持续发展。8国家新代智能治理专业委员会,“新代智能伦理规范”,2021-09-25,https:/ 分析研究当前经济形势和经济作 中共中央总书记习近平主持会议”,2023-04-28,https:/ Government,“C

3、ountries agree to safe and responsible development of frontier AI in landmarkBletchley Declaration”,2023-11-01,https:/www.gov.uk/government/news/countries-agree-to-safe-and-responsible-development-of-frontier-ai-in-landmark-bletchley-declaration.2联合国,“秘书组建级别咨询机构,全球39名专家共商智能治理”,2023-10-26,https:/news

4、.un.org/zh/story/?/?/?.1中央信办,“全球智能治理倡议”,2023-10-18,http:/ AI)”,是指能的通AI模型,能执泛的任务,并达到或超过当今最先进模型的能,最常的是基础模型。前沿智能提供了最多的机遇但也带来了新的险。本报告提供了前沿智能机构潜在的最佳实践清单,以及向中国机构的研发实践案例与政策制定指南。这些是经过泛研究后收集的,考虑到这项技术的新兴性质,需要定期更新。安全过程并未按重要性顺序列出,是按主题进总结,以便读者能够理解、解释和较前沿机构的安全政策,及其在国内的适性。本报告参考了各个前沿智能机构公布的最佳实践、英国政府前沿智能安全的新兴流程、国内外相

5、关政策法规等多份参考资料(详附录A)。11Anthropic,“Anthropics Responsible Scaling Policy”,2023-09-19,https:/ Level”,2023-11-20,https:/en.wikipedia.org/wiki/Biosafety_level.9Jason Wei et al.,“Emergent Abilities of Large Language Models”,2022-08-31,https:/ Bengio等专家的建议。2.本报告的适对象本报告是为中国领先的智能技术研发机构和政策研究机构编写的,以帮助他们更好地了解前沿智

6、能安全的实践和政策。我们励这些机构参考国际同经验,结合国内实际情况,在实现负责任智能的过程中,提升从原则到实践、技术与治理相结合的能。虽然可能有些实践与多种类型的智能机构相关,但负责任扩展策略等部分实践是专为前沿智能,不是为能以及险较低的智能设计的。我们欢迎前沿智能机构,根据其独特的模型特性、开发和应环境以及潜在险,主制定符合情况的负责任智能实践。当前许多智能研发机构的运营险较低,预计不会考虑采取如此系列的实践措施。这符合我们对智能险采取相称性治理和促进创新法的理念。但前沿智能研发机构在促进前沿智能安全开发和部署发挥的重要作,也将使包括前沿机构在内的更泛的智能态系统受益。因此,随着最佳实践的不

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要内容概括如下: 1. 前沿人工智能安全成为全球和中国重点关注的议题。习近平主席宣布中国将提出《全球人工智能治理倡议》,联合国组建人工智能高级别咨询机构,28个国家和欧盟签署《布莱切利人工智能安全宣言》。 2. 前沿人工智能机构在人工智能安全研究方面具有独特地位,应开展人工智能安全研究,开发防范系统危害和风险的工具,与外部研究人员合作研究和评估其系统的潜在社会影响,并公开分享风险研究成果。 3. 含保护模型权重在内的安全控制至关重要,包括在整个人工智能系统(包括基础设施和供应链)中实施强有力的网络安全措施和流程,了解人工智能系统中的资产并采取适当措施进行保护,保持对安全风险的最新理解,制定事件响应、升级和补救计划等。 4. 漏洞报告机制使外部人员能够识别人工智能系统中的安全问题,包括建立漏洞管理流程,借鉴已建立的软件漏洞报告流程,制定协同漏洞披露和信息共享的协议和机制。 5. 人工智能生成材料的标识信息有助于识别人工智能生成的内容,包括研究能够识别人工智能生成内容的技术,探索对各种扰动具有鲁棒性的人工智能生成内容的数字水印使用,探索人工智能输出数据库的使用。 6. 模型报告和信息共享提高了政府对前沿人工智能开发和部署的可见性,包括共享与模型无关的有关一般风险评估、缓解和管理流程以及最佳实践的信息,在训练之前、训练期间和部署之前共享有关某些前沿人工智能模型的特定信息,根据适用性,与不同方共享不同信息。 7. 防止和监测模型滥用是前沿人工智能安全的重要一环,包括建立流程来识别和监测模型的滥用,实现模型输入和输出过滤器,实施额外措施来防止有害输出,实施基于用户的API访问限制和监测等。 8. 数据输入控制和审核可以帮助识别和删除可能增加前沿人工智能系统所拥有的危险能力或带来风险的训练数据,包括在收集训练数据之前实施负责任的数据收集实践,在使用输入数据训练人工智能系统之前对其进行审核等。 9. 负责任扩展策略为前沿人工智能机构在扩展其前沿人工智能系统的能力时提供了一个管理风险的框架,包括在开发或部署新模型之前进行彻底的风险评估,预先确定“风险阈值”,根据每个风险阈值预先承诺采取特定的额外缓解措施等。
前沿人工智能如何进行风险管理? 如何评估人工智能模型的安全性? 人工智能如何保护用户隐私?
客服
商务合作
小程序
服务号
折叠