安远AI：2024前沿人工智能安全的最佳实践-面向中国机构的研发实践案例与政策制定指南-三个皮匠报告

1、执摘要执摘要前沿智能安全已成为全球和中国重点关注的议题2023年1018，习近平主席在第三届“带路”国际合作峰论坛开幕式主旨演讲中宣布中将提出全球智能治理倡议1，重申各国应在智能治理中加强信息交流和技术合作，共同做好险防范，形成具有泛共识的智能治理框架和标准规范，不断提升智能技术的安全性、可靠性、可控性、公平性。2023年1026，联合国秘书古特雷斯宣布，联合国正式组建个新的“智能级别咨询机构”2，以探讨这项技术带来的险和机遇，并为国际社会加强治理提供持。2023年111，中国、美国在内的28个国家和欧盟，共同签署了布莱切利智能安全宣3，致认为前沿智能技术可能会引发巨险，尤其是在络安全、物技术

2、和加剧传播虚假信息等。此前的2023年428，中共中央政治局会议明确提出，要重视通智能发展，营造创新态，重视防范险4。2023年710，国家信办等七部联合公布成式智能服务管理暂办法5。随着前沿智能的快速发展，按照关于加强科技伦理治理的意6、新代智能治理原则7、新代智能伦理规范8等治理件，社会应积极落实对更级智能的潜在险研判和防范，确保智能安全可靠可控，推动经济、社会及态可持续发展。8国家新代智能治理专业委员会,“新代智能伦理规范”,2021-09-25,https:/ 分析研究当前经济形势和经济作中共中央总书记习近平主持会议”,2023-04-28,https:/ Government,“C

3、ountries agree to safe and responsible development of frontier AI in landmarkBletchley Declaration”,2023-11-01,https:/www.gov.uk/government/news/countries-agree-to-safe-and-responsible-development-of-frontier-ai-in-landmark-bletchley-declaration.2联合国,“秘书组建级别咨询机构，全球39名专家共商智能治理”,2023-10-26,https:/news

4、.un.org/zh/story/?/?/?.1中央信办,“全球智能治理倡议”,2023-10-18,http:/ AI)”，是指能的通AI模型，能执泛的任务，并达到或超过当今最先进模型的能，最常的是基础模型。前沿智能提供了最多的机遇但也带来了新的险。本报告提供了前沿智能机构潜在的最佳实践清单，以及向中国机构的研发实践案例与政策制定指南。这些是经过泛研究后收集的，考虑到这项技术的新兴性质，需要定期更新。安全过程并未按重要性顺序列出，是按主题进总结，以便读者能够理解、解释和较前沿机构的安全政策，及其在国内的适性。本报告参考了各个前沿智能机构公布的最佳实践、英国政府前沿智能安全的新兴流程、国内外相

5、关政策法规等多份参考资料（详附录A）。11Anthropic,“Anthropics Responsible Scaling Policy”,2023-09-19,https:/ Level”,2023-11-20,https:/en.wikipedia.org/wiki/Biosafety_level.9Jason Wei et al.,“Emergent Abilities of Large Language Models”,2022-08-31,https:/ Bengio等专家的建议。2.本报告的适对象本报告是为中国领先的智能技术研发机构和政策研究机构编写的，以帮助他们更好地了解前沿智

6、能安全的实践和政策。我们励这些机构参考国际同经验，结合国内实际情况，在实现负责任智能的过程中，提升从原则到实践、技术与治理相结合的能。虽然可能有些实践与多种类型的智能机构相关，但负责任扩展策略等部分实践是专为前沿智能，不是为能以及险较低的智能设计的。我们欢迎前沿智能机构，根据其独特的模型特性、开发和应环境以及潜在险，主制定符合情况的负责任智能实践。当前许多智能研发机构的运营险较低，预计不会考虑采取如此系列的实践措施。这符合我们对智能险采取相称性治理和促进创新法的理念。但前沿智能研发机构在促进前沿智能安全开发和部署发挥的重要作，也将使包括前沿机构在内的更泛的智能态系统受益。因此，随着最佳实践的不

安远AI：2024前沿人工智能安全的最佳实践-面向中国机构的研发实践案例与政策制定指南（76页）.pdf

相关报告