1、郭晓辉平安人寿质量管理团队副总经理郭晓辉平安人寿 质量管理团队副总经理目前全面负责质量团队的管理工作。通过整合测试,重塑了寿险的质量体系建设:包括组织治理、梯队建设、缺陷管理、研发质效度量、自动化测试、工具平台等。近年来在AI重塑测试方面积累了宝贵的经验。加入寿险前,曾供职于腾讯、百度等多家知名互联网企业,深耕质量工作16年,有丰富的软件质量保障体系建设经验。多次带领团队在顶级行业峰会(QECon、TOP100)做测试相关报告分享,获得广泛好评。目录CONTENTS挑战与机遇0102 思考与应对探索与实践03结语与展望04 PART 01挑战与机遇:AI编码质量和降本风险代码质量 GitHub
2、25年AI代码缺陷密度提升23%辅助编程 QEcon2025降本增效主动人力资源下降u过去3年,每年减少平均XX%人力(开发+测试)老的质量风险依然存在,新的质量风险加速到来UI 代码价值 GitClear24年AI代码重复率同比上升8倍技术债的前置化,代码评审、安全缺陷LLM目前不擅长大型复杂软件编程现实中生产软件大都属此类,出现AI引发的生产问题问题时间损失OpenAI服务中断交易对账故障出行服务崩溃线上课堂崩溃云服务崩溃2024.4 基础设施下线:全网接口504,多个依赖服务中断 AI代码:复制开源代码漏洞,带出浮点数精度问题2024 应急响应资源缩减:无法叫车、通勤瘫痪20242025
3、.4 集群过载:核心业务瘫痪 过载无预警:课程中断,直播业务停摆人力结构调整u项目化趋势,外勤占比提升50%,自动化落地要求加大u25年Q2发布开发故事数同比提升46.2%u测试缺陷数同比增长31.8%AI代码占比爆炸式增长25年5月202422年23年24年25年开发测试开发提速被动测试资源占比持续下降一、能驾驭AI的测试:LLM底层是,可能被滥用(),代码质量下降是大概率事件,测试将更被依赖:(手工用例+手工点点点 调教AI+确认用例+调教自动化代码+确认缺陷)左移(,白盒、TDD、静态扫描、),自动化测试,右移(,总结,风险洞察,持续改进)二、掌握AI的紧迫性:1、:质量、效率背后,还是
4、!2、:幻觉、上下文理解力、输出不确定性,持续改善3、需求因为AI提的更多更快,开发因为AI加速编码三、一些有利的条件:大模型成本降低,能力提升,使用环境改善.LLM编码引入风险的共识,开发人员在慎用LLM知识库缺失,需要显性化如寿险测试的探索:环规则类测试、分析类工作、单据对比LLM辅助编程的短期效率红利与长期债务陷阱-2025年QEcon上海寿险AI编码给到测试压力AI编码-测试缺陷故事比:0.XX非AI编码-测试缺陷故事比:0.XX79%兄弟公司神兵All in AI 测试用例生成接口自动化造数安全测试各BU积极探索CX:UI自动化YH:AI用例YLX:精准测试案例&信心积累外部调研结果
5、:各大公司测试团队用例设计,测试数据准备,自动化测试方面积极开展探索,并有不错的效果。1兄弟公司情况:除上述子领域,集团研发管理平台团队(神兵)All in AI,牵引各BU也在积极探索应用场景,包括精准测试、安全测试。2寿险测试情况:围绕自动化探索,近期开发用AI编码,代码质量出现下降趋势,需要对AI编码质量展开评价,加速自动化提效。3行业标杆UI 活动公司效果UI自动化用例生成造数知识工程建设接口自动化B 接口覆盖率提升,线上故障率下降 覆盖率、异常检测准确率、效率提升TA 复杂场景造数耗时h级降至m级 跨境订单构造从3h缩短至10mBA AI完成90%标准化操作大幅提效 自动爬取+语义分
6、析,动态更新测试AI应用25年之前单点25年以来专项化 East2.0造数 线上问题检查 单证对比 KPI牵引 AI用例替代率、问题发现率 AI用例设计 AI智能造数 AI自动化+用例转化PART 02思考与应对:从单点到闭环需求/设计复审用例设计用例评审冒烟测试UAT测试回归测试发布&生产验证ST测试度量&改进耗时2.28d2d1.4d1d4.46d1d2.62d1.8d2.28d12.1%10.6%7.43%5.31%23.67%5.31%13.91%9.55%12.1%用例设计20.6%造数33%用例执行41.6%(自动化+手工)缺陷分析4.8%24年TOP4测试活动,占整体活动耗时75