《仲思宇-基于业务流程管理的客户端AI Agent智能化测试实践.pdf》由会员分享,可在线阅读,更多相关《仲思宇-基于业务流程管理的客户端AI Agent智能化测试实践.pdf(35页珍藏版)》请在三个皮匠报告上搜索。
1、基于业务流程管理的客户端AI Agent智能化测试实践仲思宇58同城-本地生活-测试平台研发部负责人目录0102030406背景与挑战:业务流程视角下的移动端 AI 测试困境核心架构:业务流程管理+AI Agent 与 Skills 协同体系实践落地:业务视角下的单流程驱动多平台执行总结与展望业务流程视角下的移动端 AI 测试困境背景与挑战背景与痛点传统UI自动化测试的挑战维护成本高页面改版导致用户大量失效元素定位频繁变更用例编写及调试耗时成本高稳定性差弹窗干扰导致执行失败网络波动影响结果失败难以自动恢复不能灵活断言纯AI方案的问题完全依赖AI推理每一步操作,虽然灵活但成本高、耗时久、一致性差
2、,且难以沉淀业务知识UI自动化测试方向分析传统方式 vs AI测试覆盖传统UI自动化适用场景:稳定业务流程、核心链路回归优势:0消耗token,部分场景稳定执行劣势:维护成本极高、灵活性差覆盖率:约40-60%,再高就得看成本了AI测试适用场景:UI、回归、冒烟、探索性测试优势:灵活自适应、无需精确定位劣势:长链路上下文积累压缩风险,任务失败率高覆盖率:约70-85%(有幻觉风险影响)AI测试的核心问题不稳定&业务脱节相同提示词不同链路操作、对页面理解不一致复杂场景下决策链过长,越复杂的场景执行成功率越低AI 测试规模化落地受阻移动端测试的核心不是适配多少平台,而是能否以统一业务流程驱动多端并
3、行测试,实现标准统一、效率提升客户端AI测试绕不开的Plan模式和ReAct模式的问题 ReAct 优势灵活性强:-可根据实时观察调整策略适应未知:-适合探索性任务和开放场景可解释性:-推理过程可见,便于调试自我纠正:-可从错误中反思并调整Plan 模式(Planning+Execution),先规划后执行ReAct 模式(Reasoning+Acting),边推理边行动交替进行推理(Reasoning)和行动(Acting),每一步都基于前一步的观察结果进行推理,然后执行下一步行动。先由 LLM 生成完整的执行计划,然后按步骤顺序执行,执行过程中可根据情况调整计划。ReAct 劣势效率低:-
4、每步都需要 LLM 推理,耗时长(3-10 秒/步)不稳定:-AI 幻觉导致结果不一致无沉淀:-每次执行都是独立推理,无法积累知识 Plan 优势全局视角:-提前规划整体流程,避免 局部最优可并行:-独立步骤可并行执行易优化:-可对计划进行预优化和验证可复用:-相似任务可复用计划模板 Plan 劣势规划错误:-初始计划错误导致整体失败灵活性差:-难以应对突发变化和异常仍然高成本:-规划阶段仍需 LLM 全量推理知识沉淀弱:-计划难以结构化和复用“业务地图”+Plan 保证“做什么”+ReAct 保证“怎么做”=稳定性 85%+|成本 70%业务流程管理+AI Agent 与 Skills 协同
5、体系核心架构Agent技术选型:自研架构+参考开源工程项目名称项目名称开源方开源方适配平台适配平台关键关键 AI 能力能力GitHub 地址地址OpenAutoGLM智谱 AIAndroid视觉界面理解、长流程任务、50+App 适配、敏感操作确认https:/ App 任务规划、GPT4V/QwenVLhttps:/ UI 分析、知识库生成https:/ AI 测试 Agent。客户端AI Agent架构核心理念业务地图驱动规划+观察双模式轻量化执行层封装端skills能力业务流程管理+AI Agent 与 Skills 协同体系业务流程管理层统一业务流程定义模版化链路管理业务场景抽象知识图
6、谱兜底Agent决策层智能模版匹配多平台适配决策子步骤自愈调度执行策略优化Skills执行层跨平台规则统一规范设备适配封装Skills自动注册 架构优势流程驱动:以业务流程为主线,串联 AI 决策与 Skills 执行深度绑定:AI Agent 与 Skills 能力与业务流程深度整合协同高效:三层架构各司其职,协同完成测试任务全端原生适配:支持iOS/Android/鸿蒙/PC-Web多端协议层适配智能匹配链路:向量+关键词双层混合模板匹配算法,准确率比纯关键词匹配提升30%执行流程:规划步骤正文 苹方-简字体 12-14号字 常规体 黑色淡色 25%输入提示词AI解析推理步骤AI驱动设备A