刘勇-检索增强（RAG）能提升大模型的推理能力吗.pdf

上传人：哆哆

编号：186319

2024-11-01

PDF 29页 2.82MB

《刘勇-检索增强（RAG）能提升大模型的推理能力吗.pdf》由会员分享，可在线阅读，更多相关《刘勇-检索增强（RAG）能提升大模型的推理能力吗.pdf（29页珍藏版）》请在三个皮匠报告上搜索。

1、检索增强（RAG）能提升大模型的推理能力吗？中国人民大学高瓴人工智能学院刘勇2目录丨CATALOGUE背景介绍基本设定理想情况有噪音情况01020304What is RAGLLMs 存在问题幻觉问题：有论文证实，自回归预训练的大语言模型的幻觉问题不可避免1，LLM无可避免的会提供部分虚假信息时效性问题：规模越大，大模型训练的成本越高，更新知识的代价越大，对于一些高时效性的任务，大模型无能为力数据安全：OpenAI 已经遭到过几次隐私数据的投诉，企业不会把自己的经营数据、合同文件等机密文件和数据上传到互联网上的大模型RAG（Retrieval-Augmented Generation,检索增

2、强）是解决上述问题的当前比较流行的方法231 Calibrated Language Models Must Hallucinate Adam.In STOC2 Retrieval-augmented generation for large language models:A surveyWhat is RAG第五步：生成答案第一步：用户提出问题第二步：检索文档第三步:选出相关文档第四步：Query+文档输入大模型LLM:(|)其中，为query,为答案5Can RAG Help Reasoning?RAG:,1,2,其中，为query,为document,为答案 RAG提供额外的信息Que

3、stion：RAG能提升推理能力吗？Chain of Thought(CoT)理论上已经证明COT能提升LLM的推理能力36相当于增加的Transformer的深度Chain of Thought（COT）能增加推理的原因COT：,1,2,为推理的中间结果1=|,2=|,1,=,1,3 Chain-of-thought prompting elicits reasoning in large language models.In NeurIPS 20227COT：推理理论上可以重复很多次RAG：一般只执行一次COT:,1,2,RAG:,1,2,Can RAG Help Reasoning?推理

4、过程第一步：什么是“我和我的祖国”第二步：有哪些演员第三步：各自的出生年月若检索到文档信息有所有演员姓名信息则第一、二步可省略降低其推理难度，增加LLM的推理能力8考虑问题：“电影我和我的祖国的各位主演生于哪一年”Can RAG Help Reasoning?RAG能多大程度上提升LLM推理能力？9目录丨CATALOGUE基本设定理想情况有噪音情况背景介绍0103040210推理树1层2层3层连接概率有pl的概率节点能被检索文档替代推理树11目录丨CATALOGUE有噪音情况背景介绍理想情况基本设定0102040312Can RAG Help Reasoning?13文档内包含某个节点的信息

5、Can RAG Help Reasoning?能无限裂变下去吗？用于推理该节点的其余底层节点也不再需要文档消除一个节点后，引发裂变反应，数个低层节点也会被消除第层节点被erase的概率：所连的+1层节点的推理不再需要某个文档中包含该节点的信息14连接概率连接概率1 有有的概率节点能被检索文档替代的概率节点能被检索文档替代 =+其中，为连接的稀疏程度，为节点个数，为检索概率Can RAG Help Reasoning?几个概念：为上一层节点被消除的比例()：为这一层被消除的概率代表消除概率的增长 0表示反应继续15节点被erase的概率逐渐收敛至g(t)的零点t蓝线上层被消除概率蓝线上层被消除

6、概率绿绿线表示这层线表示这层裂变概率裂变概率 =裂变增长率裂变增长率分界点分界点Can RAG Help Reasoning?该零点t位置与retrieval质量以及层与层之间连接的稀疏程度相关若零点位置t，则可以持续进行裂变反应，否则裂变反应中止16代表检索文档替代某个节点的概率，代表层与层连接的稀疏程度，为该层的节点数量在满足条件在满足条件时，就会导致无法持续进行裂变反应时，就会导致无法持续进行裂变反应例子：=0.5,=3,那么1 1=0.68Jingyu Liu,Jiaen Lin,Yong Liu*.How Much Can RAG Help the Reasoning of LLM?

刘勇-检索增强（RAG）能提升大模型的推理能力吗.pdf

相关报告