《黄涛 AI 时代 App 质量可观测平台实践与探索.pdf》由会员分享,可在线阅读,更多相关《黄涛 AI 时代 App 质量可观测平台实践与探索.pdf(28页珍藏版)》请在三个皮匠报告上搜索。
1、G O P S 全 球 运 维 大 会 暨 研 运 数 智 化 技 术 峰 会2 0 2 5 上 海 站G O P S 全 球 运 维 大 会 暨 研 运 数 智 化 技 术 峰 会2 0 2 5 上 海 站AI时代App质量可观测平台实践与探索姓 名:黄涛时 间:2025/10/18G O P S 全 球 运 维 大 会 暨 研 运 数 智 化 技 术 峰 会2 0 2 5 上 海 站个人简介姓名专家工程师十余年App开发和性能优化领域的工作经验。曾在多个高难度项目中主导系统底层和应用层的性能优化,成功解决了诸多技术难题,显著提升了产品的效率和用户体验。目前,在腾讯端服务的 Bugly 团队
2、担任技术负责人,专注于App客户端质量可观测系统的研发和策略制定工作。G O P S 全 球 运 维 大 会 暨 研 运 数 智 化 技 术 峰 会2 0 2 5 上 海 站目录总结展望:AI驱动的质量新未来探索:“智”能分析新范式背景:快节奏迭代下的质量挑战实践:可观测平台的核心能力G O P S 全 球 运 维 大 会 暨 研 运 数 智 化 技 术 峰 会2 0 2 5 上 海 站01背景:快节奏迭代下的质量挑战G O P S 全 球 运 维 大 会 暨 研 运 数 智 化 技 术 峰 会2 0 2 5 上 海 站高速迭代下的质量压力迭代流程迭代周期短(2周左右)版本需求多(30-80)
3、合流时间短(1d)灰度用户少(2k)G O P S 全 球 运 维 大 会 暨 研 运 数 智 化 技 术 峰 会2 0 2 5 上 海 站版本迭代中的质量痛点环境鸿沟测试环境与真实环境差异导致问题覆盖不全面资源瓶颈人工测试资源有限,灰度用户和灰度时间覆盖面不足信息衰减发生问题后,缺乏实时监控与反馈机制,导致关键信息的丢失数据孤岛与指标缺失零散的反馈,缺乏可信的质量指标,无法依据数据做出正确的决策协作效率低下由于没有统一可以查看问题的地方,团队间协作也会有困难G O P S 全 球 运 维 大 会 暨 研 运 数 智 化 技 术 峰 会2 0 2 5 上 海 站可观测性平台的必要性快速定位与优
4、化通过数据驱动的方法,精准定位性能瓶颈和稳定性问题,减少人工分析时间,加速问题解决过程,提高开发团队效率。全链路实时监控建立覆盖应用全生命周期的监控体系,从开发环境到测试环境再到生产环境,实时掌握应用性能、稳定性和用户体验状况,及时发现异常。问题闭环处理构建从指标异常问题定位解决方案行动实施效果验证的完整闭环,确保每个问题都能得到及时处理并验证解决效果。预测与预防能力基于历史数据和趋势分析,建立预警机制,在问题造成大规模影响前提前发现并处理,从被动响应转向主动预防。跨团队协作提升打破产品、开发、测试和运维之间的信息壁垒,提供统一的数据视图和协作平台,促进团队间高效沟通与协作,共同提升产品质量。
5、“可观测性平台不仅是技术工具,更是质量文化的重要组成部分,能够帮助团队建立数据驱动的决策机制,持续提升产品质量和用户体验。”G O P S 全 球 运 维 大 会 暨 研 运 数 智 化 技 术 峰 会2 0 2 5 上 海 站AppApp质量可观测平台应用场景“可覆盖CI/CD/CO各阶段,提供全生命周期的质量监控”开发分支质量对比CI版本发布HotHot FixFixCDABAB实验日常运维COG O P S 全 球 运 维 大 会 暨 研 运 数 智 化 技 术 峰 会2 0 2 5 上 海 站02实践:可观测平台的核心能力G O P S 全 球 运 维 大 会 暨 研 运 数 智 化
6、技 术 峰 会2 0 2 5 上 海 站AppApp质量可观测平台架构应用层面向用户的价值输出层。提供:全局指标dashboard、智能告警、Issue下钻分析、归因诊断等能力。ETL层核心数据处理引擎。具备:堆栈符号化、日志解析(Tombstone,Minidump)、智能聚类、指标计算、特征分析(如反作弊清洗)等能力。接入层高并发、高可用的数据上报网关,日均处理百亿级别的指标和个例事件数据。采集层多端支持(移动、桌面、Web、小程序、Flutter、VisionOS)。核心能力:高可用、高保真的数据采集链路,守护进程、捕获成功率优化。“提供异常数据的采集和分析服务,帮助开发者及时发现并解决