《香港大学:2025警惕AI“信口开河”:大语言模型幻觉控制能力深度测评报告(12页).pdf》由会员分享,可在线阅读,更多相关《香港大学:2025警惕AI“信口开河”:大语言模型幻觉控制能力深度测评报告(12页).pdf(12页珍藏版)》请在三个皮匠报告上搜索。
1、1警惕 AI“信口开河”:大语言模型幻觉控制能力深度测评报告警惕 AI“信口开河”:大语言模型幻觉控制能力深度测评报告蒋镇辉1,鲁艺1,吴轶凡1,徐昊哲2,武正昱1,李佳欣11香港大学经管学院,2西安交通大学管理学院摘要在人工智能浪潮席卷全球的背景下,大语言模型(LLM)正加速扎根知识服务、医疗诊断、商业分析等专业领域,其应用深度与广度持续拓展。然而,一个关键障碍始终横亘在前:“幻觉”即输出看似逻辑自洽,实则与事实相悖或偏离语境的现象已成为制约其可信度的关键瓶颈。为此,香港大学蒋镇辉教授领衔的人工智能评估实验室(AIEL),针对 37 个中美大语言模型(含 20 个通用模型、15 个推理模型、
2、2 个一体化系统),从事实性、忠实性幻觉两方面评估其幻觉控制能力。测评结果显示,GPT-5(思考模式)和 GPT-5(自动模式)分别斩获冠亚军,Claude 4 Opus 系列紧随其后;字节跳动公司的豆包 1.5 Pro 系列表现突出,领跑国产模型阵营,但与国际顶尖模型之间仍存在显著差距;整体来看,本次测评模型更擅长于避免产生忠实性幻觉、但事实性幻觉控制能力仍有短板。这项研究揭示了 AI 可信度需兼顾事实与忠实性幻觉协同提升的必要性,为未来模型的优化提供了明确方向,推动 AI 从“能生成”向“可信赖”的关键性迈进。2大语言模型(LLM)正被迅速地应用在知识服务、决策支持、智能导航、客户服务等专
3、业场景的核心环节。而在这一过程中,LLM 生成内容的真实性与可靠性,成为了支撑其应用价值的核心基石。“幻觉”现象 即模型输出看似合理却与事实不符或偏离语境 已成为制约其可信度的核心问题。识别大语言模型的幻觉问题尤为重要:比如,在金融领域,一个虚构的并购公告或一套捏造的财务数据如若被大模型使用,会误导投资人做出错误的决策;在法律领域,大模型或许会错误地引用一个不存在的法律判例或已失效的条款来生成法律咨询,造成无法挽回的后果;而在医疗保健领域,大模型模型有可能因幻觉而将两种不同疾病的症状混淆,从而提出错误的诊断或治疗方案,直接威胁到患者的生命健康。因此,控制幻觉的能力,成了衡量 AI 可信度的“生
4、死线”。为此,由蒋镇辉教授领导的香港大学经管学院人工智能评估实验室(AIEL)针对 37 个中美大语言模型(含 20 个通用模型、15 个推理模型和 2 个一体化系统)的幻觉控制能力开展专项测评,旨在揭示不同模型在规避事实错误与保持语境一致性方面的真实表现。“幻觉”分类“幻觉”分类“幻觉”指模型生成内容在事实依据或语境契合度上存在的问题,具体分为两类:事实性幻觉和忠实性幻觉。事实性幻觉是指模型输出内容与真实世界信息不符,既包括对已知知识的错误调用(如张冠李戴、数据错记),也包括对未知信息的虚构(如编造未验证的事件、数据)。忠实性幻觉是指模型未能严格遵循用户指令,或输出内容与输入上下文矛盾,包括
5、遗漏关键要求、过度引申、格式错误等。为清晰呈现大语言模型幻觉的产生路径,并帮助读者更好理解,其核心要素的简要示意图如图 1 所示。3图 1.大模型幻觉产生示意图测评任务与标准测评任务与标准(1)测评题目(1)测评题目事实性幻觉测试题事实性幻觉测试题。此类题目旨在考察模型输出内容与客观事实的一致性,设计过程结合现有研究成果与大模型实际应用中的常见错误模式,具体分为三类:1)信息检索类:这类问题聚焦对精确信息的查询需求。我们通过设计自主查询式问题(覆盖人物、历史、文献等关键维度),要求模型基于这些问题自主开展信息检索。最终通过对信息真实性的验证,考察模型是否会生成过时或虚构的答案(具体示例见表 1
6、);4表 1 信息检索类题目示例题目题目参考答案参考答案模型错误回答示例模型错误回答示例帮我在这段文字的括号内插入三篇文献,在后面并给出文献标题:了解消费者的个性化隐私偏好对于企业和政策制定者而言至关重要,有助于建立信任与合规机制,并指导有效的政策制定。现有方法大多依赖于私密信息,如专有的用户行为数据以及个体层面的口统计和社会经济因素,或者需要用户明确输入偏好,这些方式可能具有侵入性且较为繁琐,进而可能引发用户不满(文献插在这里)。参考答案包括但不限于:1 Awad,N.F.,&Krishnan,M.S.(2006).Thepersonalization privacyparadox:An e