1、王伟|腾讯云智能 区域解决方案总监分钟级大模型应用搭建加速企业智能化创新腾讯混元,坚持全链路自研,兼顾长期主义与实用创新2020-2022推出百亿/千亿广告推荐大模型2021-2022发布万亿混元NLP大模型 2023.05广告、会议、文档等头部业务接入混元2025.03新一代旗舰通用模型混元 TurboS 发布深度思考模型 T1 正式版发布3D创作引擎全新升级2023.09混元大模型正式对外发布2024.5开源业界首个中文DIT文生图模型2024.6混元多模态模型发布SuperClue 国内第一2024.11 开源 Hunyuan-3D 生成模型2025.01开源 Hunyuan-3D 2.
2、02024.09混元 Turbo 发布2024.11混元开源大语言模型 Hunyuan-large 2024.12 开源HunyuanVideo 生成模型2025.02混元深度推理模型T1 预览版上线腾讯元宝2025.07混元3D世界模型正式发布并开源2025.08开源0.5B,1.8B,4B,7B4款小尺寸模型混元Large Vision模型正式发布从短期记忆到长期记忆的演进短期记忆的局限仅支持短对话单次对话内有效预设内容决定能力边界长期记忆的突破超长复杂任务处理跨session提取长期记忆无限工具动态添加/创造从图文问答向全模态交互的演进图文问答场景的局限无法理解动态的时序场景输出形态和交
3、互多样性具有局限全模态交互场景的突破多模态的统一输入和输出具身场景的指令理解和动作转化现实世界理解和对话交互物理空间感知和任务执行从单智能体到多智能体协同的演进单智能体的局限多智能体协同Agent的突破“全知困境”无法打破的认知天花板“解耦鸿沟”复杂场景难以解耦和并行“孤点危局”集中式架构的崩塌风险“群策群力”多智能体构建能力网络涌现2 添加多个Agent1 创建Agent“协作容错”多智能体容错与自适应进化“自主协同”协作框架下自主解耦与并行执行产业落地,从传统AI到新AI传统AI技术栈身份核验数智人OCR语音生成式AI技术栈 知识问答主要用于内部知识的高效分享,以及对外服务的提效。广泛应用
4、于通信、政务、能源、教科、金融等行业知识问答&平台 使用大模型进行分析,规划和指导下一步的行动。如智能招采场景,通过大模型对供应商做辅助评审分析。智能分析与决策 通过大模型来提升运维的智能化水平和效率,对异常情况的提前预判等。典型场景运营商、电网的高效调度等。智慧运维 通过大模型提升研发人员编程的效率。高技术门槛行业对AI编程需求最为突出,具有有一定规模研发人员,利用大模型提升研发团队效率。智能编程 金融、教科、传媒等行业客户通过大模型的生成能力用于研报内容生成、文档生成、媒体内容生成等场景。内容生产RAG(解析、拆分)WorkflowMCP插件Prompt EngineeringAgentL
5、LM/MLLM异构资源管理多模态标注LLM训推加速微调蒸馏潮汐调度 通过大模型提升客服服务能力,引入数字人作为数字客服。理解能力大幅提升,回答的精准性大幅提高,降本增效明显。大模型客服腾讯云智能体开发平台,助力企业级智能体构建文档解析向量化文档拆分多轮改写Rerank多模态原子能力模型基座金融/教育/医学行业大模型精调知识大模型/多模态大模型三方大模型腾讯云行业大模型混元大模型应用场景政务文旅金融汽车零售泛互医疗一网通办虚拟导游代理人辅助语音助手电子说明书员工服务挂号助手物流客服助手内部合作数智人乐享企点客服营销云 官方插件:文档解析、混元文生图 MCP插件 自定义插件应用构建框架 插件中心M
6、ulti-Agent框架RAG框架WorkFlow框架企业知识库 文档 问答对数据库应用配置应用评测应用发布权限管理调用统计知识问答部分领域效果领先:在图文混排文档问答、复杂大表问答等领域有显著优势。擅长图文表解析及公式解析,已支持内外部多个大模型厂商、APP、平台调用。RAG框架:效果保持领先,解析检索工具沉淀丰富WorkFlow框架:工作流复杂应用构建能力WorkFlow,支持20+常用画布节点,支持客户通过拖拽大模型节点、参数提取节点、知识问答节点等常用原子能力编排业务流程。全局视野的Agent,支持节点灵活回退。Multi-Agent模式,支持多