1、ML-SummitML-Summitwww.cpp-www.ml-summit.orgwww.gosim.orgwww.pm-summit.orgML-SummitML-SummitML-SummitML-SummitML-SummitML-Summit梁梁新新兵兵 D De ee ep pWWi is sd do omm算算法法研研究究员员,O Op pe en nMMa an nu us s项项目目一一作作DeepWisdom算法研究员、OpenManus项目一作,MetaGPT开源核心贡献者,论文Data Interpreter/Self-Supervised Prompt Optimi
2、zation作者之一。本科毕业于广州大学,研究生就读于华东师范大学。主要研究方向为AI Agent,在智能体领域有丰富的实践经验,致力于推动AI技术的开源与普及。演演讲讲主主题题:通通用用A Ag ge en nt t的的构构建建与与赋赋能能:O Op pe en nMMa an nu us s的的实实践践与与探探索索ML-SummitML-Summit2025 全球机器学习技术大会通用Agent的构建与赋能:OpenManus的实践与探索梁新兵ML-SummitML-Summit目录CONTENTS通用 AgentOpenManus 原理OpenManus 实践展望与挑战ML-SummitM
3、L-Summit通用 Agent01ML-SummitML-Summit什么是 Agent?百度百科百度百科维基百科智能体(Agent)是指能够感知环境并采取行动以实现特定目标的代理体。在人工智能领域,智能代理(Intelligent agent)指一个可以观察周遭环境并作出行动以达致目标的自主实体。Agents continuously perceive,decide,and act autonomously.ML-SummitML-Summit一个简单的 Agent 架构AI Agent 可以理解为是一个扩展了大模型出厂能力的应用程序工具使用,是人类区别于动物的标志,也是 Agent 区别
4、于大模型的标志。Agent 的认知系统主要由记忆、推理和规划组成ML-SummitML-Summit什么是通用 Agent?通用Agent是指具备通用人工智能(AGI)能力的智能体,能够跨领域执行多样化任务,展现接近人类的水平。ML-SummitML-Summit通用 Agent 的核心能力1.学习能力:能够持续学习,不断优化自身的行为和决策能力,以更好地适应新任务和环境。2.推理能力:能够根据已有的知识和逻辑规则,通过一系列的思考和分析过程,得出结论或者解决问题的能力。3.多模态感知能力:能够感知、理解和生成多种模态的信息,例如文本、图像、视频和声音等信息。4.工具使用能力:能够利用外部资源
5、或工具来完成任务。5.社交协作能力:能够与人类或其他智能体进行有效互动。ML-SummitML-Summit通用 Agent 的核心能力1.学习能力2.推理能力3.多模态感知能力4.工具使用能力5.社交协作能力ML-SummitML-Summit学习能力Agent 能够持续学习,不断优化自身的行为和决策能力,以更好地适应新任务和环境。Agent 的学习方法:Parameter-Level UpdatesContext-Level AdaptationInteractive/Experience LearningML-SummitML-SummitParameter-Level Updates参
6、数级别微调的方法:Full fine-tuning,RLHF,LoRA,Prefix-TuningML-SummitML-SummitContext-Level Adaptation上下文级别的学习方法:检索增强生成(RAG)In-context learningML-SummitML-SummitInteractive/Experience LearningLearn-by-Interact:通过Agent与环境的交互来自动生成高质量的训练数据,然后进行模型训练或 In-context-learning 的方法,从而提升Agent在各种任务中的性能ML-SummitML-SummitInte