1、G O P S 全 球 运 维 大 会 暨 研 运 数 智 化 技 术 峰 会 2 0 2 5 上 海 站G O P S 全 球 运 维 大 会 暨 研 运 数 智 化 技 术 峰 会 2 0 2 5 上 海 站G O P S 全 球 运 维 大 会 暨 研 运 数 智 化 技 术 峰 会 2 0 2 5 上 海 站G O P S 全 球 运 维 大 会 暨 研 运 数 智 化 技 术 峰 会 2 0 2 5 上 海 站大大模模型型时时代代的的智智能能化化运运维维姓 名:李赛时 间:2025/10/17G O P S 全 球 运 维 大 会 暨 研 运 数 智 化 技 术 峰 会 2 0 2
2、5 上 海 站个人简介李赛算法专家携程AIOps团队负责人,算法专家,主要负责携程AIOps技术体系,包括智能告警、智能变更、容量治理、应用治理、根因定位等方向的工作,在人工智能技术结合运维场景方面有深入研究。多次分享技术主题,获得携程技术中心优秀讲师称号,曾多次出席过业界行业技术会议,其负责项目获得中国信通院“云服务运行安全创新成果奖”。G O P S 全 球 运 维 大 会 暨 研 运 数 智 化 技 术 峰 会 2 0 2 5 上 海 站目录故障分析系统设计Q&A背景G O P S 全 球 运 维 大 会 暨 研 运 数 智 化 技 术 峰 会 2 0 2 5 上 海 站01背景G O
3、P S 全 球 运 维 大 会 暨 研 运 数 智 化 技 术 峰 会 2 0 2 5 上 海 站运维的演进路径1990s手工运维1999 Nagios发布2010s DevOps+可观测性2012 Prometheus诞生2000s自动化运维2005 Puppet推出2020s AIOps2016 Gartner提出AIOps G O P S 全 球 运 维 大 会 暨 研 运 数 智 化 技 术 峰 会 2 0 2 5 上 海 站智能运维VS传统运维目标:从“被动响应”走向“主动预防”和“自愈运维”传传统统运运维维智智能能运运维维故障发现告警驱动,人工盯屏异常检测+根因分析,自动发现数据处
4、理系统孤立,手工分析多源融合,自动关联决策方式依赖经验数据+模型驱动,可解释性强响应速度慢(小时级)快(分钟级甚至秒级)G O P S 全 球 运 维 大 会 暨 研 运 数 智 化 技 术 峰 会 2 0 2 5 上 海 站智能运维4要素可观测性能力数据基座平台能力小模型算法能力G O P S 全 球 运 维 大 会 暨 研 运 数 智 化 技 术 峰 会 2 0 2 5 上 海 站智能运维架构G O P S 全 球 运 维 大 会 暨 研 运 数 智 化 技 术 峰 会 2 0 2 5 上 海 站架构痛点AI能力规模化与日益增长的灵活性需求之间的矛盾开始出现-AIOps能力需要面向更多的运
5、维领域,帮助释放人力成本-业务领域、特定运维领域的专家经验需要与以上能力结合、灵活插拔 第三方用户依据契约或工具来同各种AIOps模型交互,有一定的学习成本和费力度各个小模型相互独立,可能存在信息不对称G O P S 全 球 运 维 大 会 暨 研 运 数 智 化 技 术 峰 会 2 0 2 5 上 海 站AI能力演进场景与模型一一对应Transformer用于图像特征提取Transformer模型的提出G O P S 全 球 运 维 大 会 暨 研 运 数 智 化 技 术 峰 会 2 0 2 5 上 海 站AI使用形态L LL LMM(G GP PT T)迭迭代代:借助于更大的多模态数据集,
6、更深的网络结构,模型参数规模成倍增长,形成多模态大模型。G O P S 全 球 运 维 大 会 暨 研 运 数 智 化 技 术 峰 会 2 0 2 5 上 海 站运维+大模型OPS大模型G O P S 全 球 运 维 大 会 暨 研 运 数 智 化 技 术 峰 会 2 0 2 5 上 海 站智能运维4要素+大模型大模型可观测性能力数据基座平台能力小模型算法能力G O P S 全 球 运 维 大 会 暨 研 运 数 智 化 技 术 峰 会 2 0 2 5 上 海 站02故障分析系统设计G O P S 全 球 运 维 大 会 暨 研 运 数 智 化 技 术 峰 会 2 0 2 5 上 海 站告警分