当前位置:首页 >英文主页 >中英对照 > 报告详情

OpenAI:2025 GPT-5.2技术报告(英文版)(27页).pdf

上传人: 1****1 编号:990280 2025-12-15 27页 2.04MB

下载:

1、Update to GPT-5 System Card:GPT-5.2OpenAIDecember 11,20251Contents1Introduction32Model Data and Training33Baseline Model Safety Evaluations33.1Disallowed Content Evaluations.33.2Jailbreaks.43.3Prompt Injection.53.4Vision.53.5Hallucinations.63.6Health.83.7Deception.83.8Cyber Safety.93.9Multilingual P

2、erformance.103.10 Bias.104Preparedness Framework114.1Capabilities Assessment.114.1.1Biological and Chemical.124.1.1.1Multimodal Troubleshooting Virology.124.1.1.2ProtocolQA Open-Ended.134.1.1.3Tacit Knowledge and Troubleshooting.134.1.1.4TroubleshootingBench.144.1.2Cybersecurity.154.1.2.1Capture the

3、 Flag(CTF)Challenges.164.1.2.2CVE-Bench.184.1.2.3Cyber Range.194.1.2.4External Evaluations for Cyber Capabilities.2014.1.3AI Self-Improvement.204.1.3.1OpenAI PRs.214.1.3.2MLE-Bench.224.1.3.3PaperBench.234.1.3.4OPQA.244.2Research Category Update:Sandbagging.2521IntroductionGPT-5.2 is the latest model

4、 family in the GPT-5 series,and explained in our blog.Thecomprehensive safety mitigation approach for these models is largely the same as that describedin the GPT-5 System Card and GPT-5.1 System Card.In this card we also refer to GPT-5.2 Instant as gpt-5.2-instant and GPT-5.2 Thinking asgpt-5.2-thi

5、nking.2Model Data and TrainingLike OpenAIs other models,the GPT-5.2 models were trained on diverse datasets,includinginformation that is publicly available on the internet,information that we partner with thirdparties to access,and information that our users or human trainers and researchers provide

6、 orgenerate.Our data processing pipeline includes rigorous filtering to maintain data quality andmitigate potential risks.We use advanced data filtering processes to reduce personal informationfrom training data.We also employ safety classifiers to help prevent or reduce the use of harmfulor sensiti

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
根据《GPT-5 System Card: GPT-5.2》的内容,以下是全文关键点的概括: 1. **模型更新**:GPT-5.2是GPT-5系列的最新模型,继承了GPT-5和GPT-5.1的安全缓解方法。 2. **数据与训练**:GPT-5.2模型在包括互联网公开信息在内的多样化数据集上训练,经过严格的数据过滤和安全性分类器处理。 3. **安全评估**: - **禁止内容评估**:GPT-5.2在禁止内容评估中表现优于GPT-5.1,特别是在自杀/自残、心理健康和情感依赖方面。 - **越狱评估**:GPT-5.2在越狱评估中表现优于GPT-5.1。 - **视觉评估**:GPT-5.2在视觉评估中与GPT-5.1表现相当。 - **幻觉评估**:GPT-5.2在幻觉评估中表现与GPT-5.1相当或略好。 - **健康评估**:GPT-5.2在健康评估中与GPT-5.1表现相似。 - **欺骗评估**:GPT-5.2在欺骗评估中的欺骗率低于GPT-5.1。 - **网络安全评估**:GPT-5.2在网络安全评估中的合规率显著提高。 - **多语言性能评估**:GPT-5.2在多语言性能评估中与GPT-5.1表现相当。 - **偏见评估**:GPT-5.2在偏见评估中与GPT-5.1表现相当。 4. **准备框架**:GPT-5.2在生物和化学领域被视为高能力,并已激活相应的准备措施。 5. **能力评估**: - **生物和化学**:GPT-5.2在生物和化学领域的评估中表现出高能力。 - **网络安全**:GPT-5.2在网络安全领域的评估中未达到高能力阈值。 - **AI自我改进**:GPT-5.2在AI自我改进领域的评估中未达到高能力阈值。
GPT-5.2模型有哪些安全评估? GPT-5.2模型在生物化学领域表现如何? GPT-5.2模型在网络安全方面有哪些进展?
客服
商务合作
小程序
服务号
折叠