《A2--王笑吉--AIQA员工数据飞轮应用探索实践.pdf》由会员分享,可在线阅读,更多相关《A2--王笑吉--AIQA员工数据飞轮应用探索实践.pdf(30页珍藏版)》请在三个皮匠报告上搜索。
1、AI员工探索实践与知识飞轮建设王笑吉百度 资深工程师王笑吉百度 资深工程师百度MEG团队资深测试开发工程师,8年从业经验,目前主要负责百度FEED检索业务的交付质效保障相关工作,探索如何利用大模型能力提升研发交付效能,带领团队基于AI数字员工完成了交付方式从GUI向LUI转换,探索数据飞轮机制,提升AI员工的智能化程度,从而为交付提效。目录CONTENTS交付质效痛点与AIQA数字员工实践 0102 基于群聊的知识数据飞轮建设 AIQA数字员工应用与交付提效实践 03回顾与总结04PART 01交付质效痛点与AIQA数字员工实践项目交付质效痛点分析与AIQA数字员工建设背景业务交付现状及特点:
2、项目多(周700+)、迭代快,RD自主测试为主、QA值班方式参与交付效率遭遇瓶颈,迭代速度无法突破能否准出、上线决策?依赖值班QA业务知识积累测试交付经验沉淀全流程跨10+平台9个阶段、20+任务数百页学习文档与多人、多方沟通高效交付强依赖人操作复杂、流程繁琐学习、沟通成本高大模型驱动交付模式变革使用自然语言实现交付操作和流程最简化GUI交互-LUI交互人工QA-AIQA降低学习成本打破经验壁垒面向多平台操作 面向延迟高的人类面向海量学习资源 可感知的交付效能和交付体验提升24h私人助理AIQA数字员工AIQA数字员工的建设思路交付专家-双架构加持Multi-Agent,满足多专家协作需求,覆
3、盖RD交付全场景依托 AIQA数字员工 实现LUI自然语言完成交付全流程意图识别-LLM助力理解RD需求,实现全场景精准分发,参数精准识别领域知识飞轮数据收集数据处理数据评估数据应用持续优化知识反哺AIQA人规划的Agentic Workflow自主规划AI Agent数据落盘懂业务懂交付能学习识别分发Query改写信息预充消息解析多模态处理工具MCP化 核心1-具备LUI交互能力,让RD可以与AIQA数字员工使用自然语言对话 核心2-覆盖全场景的懂业务、懂交付、会思考且有执行能力、会自主学习的AIQA交付专家懂RD能执行工具组件化LUI交互智能推荐 提升交互体验召回融合推送ABCEFD规划反
4、思执行总结输出信息预充会思考S支持需结构化按人预设步骤执行的场景用户+场景+知识特征拼写纠正来源扩展专有名词替换规则大模型功能场景参数集合历史对话用户特征用户行为图片 文字智卡机器人助理链接艾特 引用灵活且发散建设思路AIQA员工的建设思路-覆盖交付全阶段、全场景、全操作从RD同学日常项目交付全过程的核心环节入手,总结数十种高频操作,归纳出五类核心Agent能力AIQA员工系统架构入口交互Agentic Workflow事件调度中心智能交付引擎测试交付智能体风险管控智能体存储层AI-QAAgent意图感知规划执行决策服务号推送iPipe流水线执行事件管理DB问题定位DB主动定位失败redis知
5、识库知识飞轮群对话处理敏捷评估自主规划AI-AgentBOS流程管理问题定位交付工具线上风险管控知识问答语义匹配问答LLM操作引导人设queryPromptLLM一、用户输入Query二、工作卡回调三、群消息主动监测感知协议机器人请求智卡类回调请求工作卡回调请求流式输出非流式输出智卡类输出机器人消息识别分发Query改写信息预充直接指定消息解析信息预充多模态处理识别分发记忆DB数据工程交互历史流水线构建测试用例交付结果业务指标代码特征业务术语知识业务系统知识需求描述质量数据监控指标用户画像业务知识测试知识交付知识超级助理垂类助理如流-机器人如流-服务号Web端-SDKiCoding comat
6、e助理类请求离线服务AIQA员工初期建设效果和问题分析AgentAUMAU(平均)DAU(日均)PV日均PV总计51333483.2340029435.1流程推进40328373.5732959358.25交付工具26316822.13429349.34线上管控19899.338.41176821.56问题定位10947.334.2578711.57知识问答10543.672.652223.7问题:AIQA员工上线后,用户量增长显著但场景渗透不均,流程推进场景贡献80%PV,问题定位、知识问答等场景使用量很低疑问:是没有问题吗?No!AIQA员工初期建设效果和问题分析问题类型交付过程问题定位交