《01-胡传锐-EverMemOs 仿生长期记忆技术的研发与落地实践.pdf》由会员分享,可在线阅读,更多相关《01-胡传锐-EverMemOs 仿生长期记忆技术的研发与落地实践.pdf(39页珍藏版)》请在三个皮匠报告上搜索。
1、EverMindEverMindKeep in Mind.Evolve over Time.技术分享技术分享2026 60 minLLM MEMORY SYSTEMSLLM MEMORY SYSTEMS大模型记忆系统大模型记忆系统EverMemOS&EverMemOS&EverMemBenchEverMemBench从记忆的第一性原理,到 EverMemOS 的算法与工程,再到 EverMemBench 的评测哲学。讲者胡传锐胡传锐团队EverMind AI EverMind AI AlgorithmAlgorithm日期2026-04-222026-04-22Self Introductio
2、nSelf Introduction自我介绍自我介绍关于本次分享者胡传锐胡传锐 /Chuanrui Hu /Chuanrui HuEverMindEverMind AI AI 算法负责人算法负责人研究方向研究方向大模型长程记忆 Self-Evolving Agents Memory-Augmented LLM当前工作当前工作EverMemOS 核心算法与工程 EverMemBench 评测体系设计过往经历过往经历360行业模型相关联系方式联系方式chuanrui.huevermind.aiKeep in Mind.Evolve over Time.EverMind EverMemOS02Age
3、ndaAgenda本次分享的主线本次分享的主线五个章节,由背景到核心,再到未来展望EverMind EverMemOS020101背景背景为什么记忆系统是 LLM 的下一块基础设施8 min0202记忆系统串讲记忆系统串讲从 Prompt Stuffing 到 Memory OS 行业方案横评12 min0303EverMemOSEverMemOSHyperMem mRAG Self-Evolving Skills22 min0404EverMemBenchEverMemBench我们为什么又做了一个 Benchmark12 min0505总结总结结论 局限 开放问题6 minSECTION
4、01SECTION 01背景背景为什么记忆系统成了 LLM 下一块基础设施01 01 背景背景先看一个真实场景先看一个真实场景当 Agent 执行一个跨周的任务,记忆在哪里失效?EverMind EverMemOS04用户用户请用上个月的分析方法,重新分析 Q4 数据。注意保留我上次手动调整过的两个参数。要完成这句话,要完成这句话,Agent Agent 必须能同时做到:必须能同时做到:跨数百条历史记录的检索跨数百条历史记录的检索上个月是时间限定,不是关键词;必须能理解时间语义。跨越多个会话的流程重建跨越多个会话的流程重建分析方法不在一条消息里,而分布在几十轮协作中。识别用户显式修改过的状态识
5、别用户显式修改过的状态手动调整过的两个参数是 Profile 级事实,而非 Episode 碎片。推断足够好的隐性判据推断足够好的隐性判据上次用户接受了什么 这就是这个用户的验收标准。四个能力没有一个能由单纯扩大 Context Window 或一次 RAG 召回完成。01 01 背景背景为什么现在成了拐点为什么现在成了拐点两股力量同时把记忆推到台面EverMind EverMemOS05力量力量 上下文的边际成本上下文的边际成本The cost of context is superlinear.128K/1M 窗口在真实长任务里依然溢出 每次 API 调用都要重放全部历史 O(N)atte
6、ntion TTFT 首 token 延迟飙升,成本填不满的黑洞窗口不是答案,它是暂存不是记忆。窗口不是答案,它是暂存不是记忆。力量力量 Agent Agent 从聊天转为执行从聊天转为执行From stateless chat to stateful execution.OpenClaw 类执行型 Agent 爆发 每个任务不是 single turn,而是跨天、跨工具 Agent 必须记住:偏好/历史决策/错误教训没有记忆的没有记忆的 Agent=Agent=每天重新培训的实习生。每天重新培训的实习生。综合结果:记忆从模型的一个特性变成了综合结果:记忆从模型的一个特性变成了Agent Ag