1、AI提效,看得见的“数字账”关钦杰|思码逸关钦杰思码逸科技咨询总监企业研发提效顾问、敏捷实践教练、质量带头人。曾为腾讯、滴滴、贝壳、泰康人寿、工银瑞信、中电万维、特斯拉、蔚来汽车、戴尔EMC等多家大中型企业,提供研发提效咨询及培训服务。目 录CONTENTS1.挑战:如何度量AI3.效果:盯紧三类硬数据4.价值:AI提效的关键洞察2.痛点:研发效能的隐形成本挑战:如何度量AIPART 01给定一个代码库,我们能区分哪些代码是AI生成的吗?如何度量AI关键挑战:Al生成代码行数激增,传统指标失效AI 让“代码行数”失效,“代码当量”不再一个“可选项”代码当量通过算法消除 AI 带来的代码“水分”
2、,直接反映一个事务从初始代码到实现后代码之间变更的复杂度通过代码当量校准的需求吞吐率/交付周期,是衡量AI最终提效成果的关键指标“ICPC”时刻之后,需要关注转型指标AI 提效转型指标Chat覆盖率大模型使用量效率指标代码当量需求交付周期需求吞吐率质量指标自动化测试覆盖率千当量缺陷率随着 AI agent 能力增强,接纳率/AI 代码占比等指标的重要性下降痛点:研发效能的隐形成本PART 02隐形成本拖慢交付与创新60%的工时被困在重复造轮子团队中:30%的代码提交集中在基础功能维护27%的时间用于写单元测试代码21%的时间用于修复缺陷及问题只有不到30%的工作量用于核心业务代码引用声明:某大
3、型开源平台迭代工作量堆叠图高重复、高复杂、标准化的基础工作是研发效能的隐形成本代码重复度高达31%,单元测试编写占30%工时但覆盖率仅38%,重点问题密度达每千当量3.6个,近3%新增函数逻辑复杂,可维护性差。3.62个/千当量严重、阻塞问题密度引用声明:某新能源汽车企业内部IT平台代码库思码逸DevInsight扫描截图效果:盯紧三类硬数据PART 02模糊的感觉清晰的账单老板会追问“快多少?省多少?”,我们需要从“感觉”走向“数据”。团队反馈只剩模糊印象“AI编程助手好像快了点?”效率数据:算清“时间账”核心指标:代码开发效率&需求交付周期某金融团队用数据证明:每人周多29%时间做重要事,
4、项目整体提速17.5%引入AI前 vs 引入AI后代码开发效率提升29%需求交付周期缩短17.5%质量数据:算清“风险账”核心指标:缺陷检出率&代码内建质量缺陷检出率及代码内建质量提升,直接降低了项目后期修复Bug的巨大成本和风险缺陷检出率提升 61%38%69%3%65%96%1%0%20%40%60%80%100%120%单测覆盖度代码不重复度复杂函数占比单测覆盖率、代码不重复度、复杂函数占比引入AI前引入AI后单测覆盖率、重复代比及复杂函数占比均有提升引入AI前 vs 引入AI后人力数据:算清“价值账”核心指标:核心业务工作时长占比团队中:30%的代码提交集中在基础功能维护27%的时间用
5、于写单元测试代码21%的时间用于修复阻塞及漏洞只有不到30%的工作量用于核心业务代码核心业务代码提交占比较引入AI前22%提升至33%引入AI前 vs 引入AI后平均圈复杂度由25降至8,超阈值模块清零,重构需求下降90%引用声明:某新能源汽车企业内部IT平台代码库思码逸DevInsight扫描截图度量AI效能看板利用期末与期初差值,使提升效果一目了然。度量AI效能看板利用AI使用量及效果数据,评估AI推广的预期收益。价值:AI提效的关键洞察PART 04从成本到价值:AI 发展的三大关键规律奥特曼对AI前景的三个观察第一,AI的能力和投入资源是对数关系。第二,AI的使用成本每12个月大约降低
6、10倍。第三,AI带来的社会经济价值是呈超级指数增长的。理性看待现阶段AI提效的幅度35524173尚未应用LLM已落地应用LLM代码生产率LLM 落地应用与代码生产率中位值应用 AI 有助于提升企业代码生产率,但提升幅度低于20%,当量数据与主观评价一致34%31%25%5%4%80%企业占比LLM 应用于研发后的实际效率提升情况数据来源:DevData 2025研发效能基准报告+17%AI 对产品效能的提升仍旧依赖于人数据来源:2024 DORA report2.3%1.