当前位置:首页 > 报告详情

张翔-SRE-Copilot大语言模型与aiops结合的探索.pdf

上传人: 张** 编号:182433 2024-10-14 31页 15.95MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了字节跳动SRE-Copilot项目,这是一个基于大语言模型AIOPS的探索。SRE-Copilot是一个多场景智能运维框架,支持Multi-Agent协作与动态编排,具备计划、记忆、反思、推理与ReAct等能力。项目负责人张翔,是字节跳动基础架构SRE数据化方向负责人,聚焦成本、稳定性、效率、服务四条主线,为SRE提供数据化与智能化支持。SRE-Copilot整体架构包括AI-Agent相关概念、SRE-Copilot优势、角色定义、框架实现的技术细节、在字节跳动的应用场景以及一些探索中的经验教训。其中,SRE-Copilot的优势包括系统复杂,依赖繁多,海量数据痛点,传统AIOPS数据无标注,训练成本高,接入/维护成本,新的故障推理交互使用成本等。在字节跳动的应用场景中,SRE-Copilot基于LLM的RCA-Agent构建,探索了知识库的构建、基础工具的构建、核心工具:LLM根因推理、工作流的构建以及Agent的应用与调试等方面。
"SRE-Copilot如何实现多场景智能运维?" "大语言模型在SRE-Copilot中的应用有哪些创新?" "如何通过SRE-Copilot实现故障的自动诊断与处理?"
客服
商务合作
小程序
服务号
折叠