1、大模型时代的知识存储范式Agentic Knowledge Base杨成彪|KGDATA杨成彪KGDATA CTO东南大学博士,南京柯基数据CTO。主要研究方向是知识图谱和自然语言处理。发表高水平论文十余篇,同时获得知识图谱和大模型相关发明专利十余项。在人工智能领域有十几年的产品研发经验,曾担任网易NLP负责人、摄星智能技术总监,成功研发多款现象级AI产品,荣获了“江苏省优秀人工智能产品金奖”、“十佳优秀人工智能软件产品”等奖项。东南大学研究生校外导师,中国中文信息学会语言与知识计算专业委员会会员。中国第一部知识图谱专著作者之一。主持“中医药产业链大模型”、“慢病护理大模型”、“儿童脑病大模型
2、”等多个国家级大模型课题研发。目 录CONTENTSI.大模型与知识工程II.智能体时代知识存储研究进展III.Agentic Knowledge Base技术架构IV.应用场景与价值V.未来趋势与挑战大模型与知识工程PART 01智能体时代的计算架构有限的内存与上下文传统软件程序大模型Agent数据库AI知识库智能体视角的知识工程知识能为智能体自主使用 记忆(Memory)数据(Message)AgentScope 1.0智能体时代知识存储研究进展PART 02智能体(Agent)智能体(Agents)感知决策指令响应环境执行知识智能体(Knowledge Agent)智能体(Agents)
3、结构定义记忆推理和规划执行大模型知识CoTToT知识图谱知识库提问回答环境软件系统硬件设备物理空间工具人员状态一个智能体例子智能体(Agents)问题:设备A不工作了怎么处理?思考:设备故障定位需要先检索故障库行动:在知识库中查询匹配的故障现象行动输入:设备A,故障现象,不工作观察:从知识库中检测到太多不工作的故障报告思考:查看故障码是最快速的故障定位方法最终答案:需要更换零件B的刀头和零件C的马达大模型知识图谱故障报告系统(设备A,包含,零件B),(零件B,异常码,C1),(C1,处理方法,更换刀头)设备A不工作了怎么处理?需要更换零件B的刀头和零件C的马达,并更新设备A的驱动程序,需要帮您
4、申请零件吗?供应链系统工具API调用环境智能体的知识和记忆智能体(Agents)中短期记忆内部知识外部知识知识库互联网持久化记忆长期记忆RAG/GraphRAGDeep ResearchMem0/MemGPTPTSFTRLRLHF用户画像上传文件投资策略代码对话记录任务中间结果任务状态知识内化:模型训练(PT,SFT,RLHF,RL)后训练(SFT、RLHF、RL)预训练(PT)知识内化:模型训练(PT,SFT,RLHF,RL)Qwen模型家族OpenAI模型家族知识外挂:检索增强(RAG,GraphRAG)Peng B,Zhu Y,Liu Y,et al.Graph retrieval-au
5、gmented generation:A surveyJ.arXiv preprint arXiv:2408.08921,2024.任务规划:深度研究(Deep Research)任务规划:深度研究(Deep Research)内存管理:上下文工程(Context Engineering)Effective context engineering for AI agents 内存管理:上下文工程(Context Engineering)https:/arxiv.org/pdf/2504.19413内存管理:上下文工程(Context Engineering)https:/arxiv.org/p
6、df/2504.19413Agentic Knowledge Base技术架构PART 03企业级知识工程的发展人工智能知识工程指南1.0企业级知识库演化路径传统知识库数字知识库智能知识库1.0智能知识库2.0存储形式纸质文档电子文档(文本为主)电子文档(文本、图片、语音、视频等)电子文档(文本、图片、语音、视频等)技术驱动无互联网技术知识图谱智能体知识库应用档案室知识管理系统、知识库门户智能搜索、智能客服、智能推荐新一代智能搜索、智能客服、智能问答、知识库助手、智能营销存在问题更新慢 效率低知识孤岛、缺乏联动、对于知识库应用支撑力度弱构建成本高交互能力弱数据信息知识智慧知识从资产化到场景化再