《刘勇-检索增强(RAG)能提升大模型的推理能力吗.pdf》由会员分享,可在线阅读,更多相关《刘勇-检索增强(RAG)能提升大模型的推理能力吗.pdf(29页珍藏版)》请在三个皮匠报告上搜索。
1、检索增强(RAG)能提升大模型的推理能力吗?中国人民大学高瓴人工智能学院刘 勇2目录丨CATALOGUE背景介绍基本设定理想情况有噪音情况01020304What is RAGLLMs 存在问题幻觉问题:有论文证实,自回归预训练的大语言模型的幻觉问题不可避免1,LLM无可避免的会提供部分虚假信息时效性问题:规模越大,大模型训练的成本越高,更新知识的代价越大,对于一些高时效性的任务,大模型无能为力数据安全:OpenAI 已经遭到过几次隐私数据的投诉,企业不会把自己的经营数据、合同文件等机密文件和数据上传到互联网上的大模型RAG(Retrieval-Augmented Generation,检索增
2、强)是解决上述问题的当前比较流行的方法231 Calibrated Language Models Must Hallucinate Adam.In STOC2 Retrieval-augmented generation for large language models:A surveyWhat is RAG第五步:生成答案第一步:用户提出问题第二步:检索文档第三步:选出相关文档第四步:Query+文档输入大模型LLM:(|)其中,为query,为答案5Can RAG Help Reasoning?RAG:,1,2,其中,为query,为document,为答案 RAG提供额外的信息Que
3、stion:RAG能提升推理能力吗?Chain of Thought(CoT)理论上已经证明COT能提升LLM的推理能力36相当于增加的Transformer的深度Chain of Thought(COT)能增加推理的原因COT:,1,2,为推理的中间结果1=|,2=|,1,=,1,3 Chain-of-thought prompting elicits reasoning in large language models.In NeurIPS 20227COT:推理理论上可以重复很多次RAG:一般只执行一次COT:,1,2,RAG:,1,2,Can RAG Help Reasoning?推理
4、过程第一步:什么是“我和我的祖国”第二步:有哪些演员第三步:各自的出生年月若检索到文档信息有所有演员姓名信息则第一、二步可省略降低其推理难度,增加LLM的推理能力8考虑问题:“电影我和我的祖国的各位主演生于哪一年”Can RAG Help Reasoning?RAG能多大程度上提升LLM推理能力?9目录丨CATALOGUE基本设定理想情况有噪音情况背景介绍0103040210推理树1层2层3层连接概率 有pl的概率节点能被检索文档替代推理树11目录丨CATALOGUE有噪音情况背景介绍理想情况基本设定0102040312Can RAG Help Reasoning?13文档内包含某个节点的信息
5、Can RAG Help Reasoning?能无限裂变下去吗?用于推理该节点的其余底层节点也不再需要文档消除一个节点后,引发裂变反应,数个低层节点也会被消除第层节点被erase的概率:所连的+1层节点的推理不再需要某个文档中包含该节点的信息14连接概率连接概率1 有有的概率节点能被检索文档替代的概率节点能被检索文档替代 =+其中,为连接的稀疏程度,为节点个数,为检索概率Can RAG Help Reasoning?几个概念:为上一层节点被消除的比例():为这一层被消除的概率 代表消除概率的增长 0表示反应继续15节点被erase的概率逐渐收敛至g(t)的零点t蓝线上层被消除概率蓝线上层被消除
6、概率绿绿线表示这层线表示这层裂变概率裂变概率 =裂变增长率裂变增长率分界点分界点Can RAG Help Reasoning?该零点t位置与retrieval质量以及层与层之间连接的稀疏程度相关若零点位置t,则可以持续进行裂变反应,否则裂变反应中止16代表检索文档替代某个节点的概率,代表层与层连接的稀疏程度,为该层的节点数量在满足条件在满足条件时,就会导致无法持续进行裂变反应时,就会导致无法持续进行裂变反应例子:=0.5,=3,那么1 1=0.68Jingyu Liu,Jiaen Lin,Yong Liu*.How Much Can RAG Help the Reasoning of LLM?