当前位置:首页 > 报告详情

分会场4_邓德杨 杨腾腾_基于eBPF的海量微服务高性能可观测实践_报告PPT.pdf

上传人: 科*** 编号:713423 2025-06-08 28页 704.56KB

1、字节跳动基于eBPF的海量微服务高性能可观测实践第三届 eBPF开发者大会中国 西安邓德杨:字节跳动系统可观测技术专家杨腾腾:字节跳动内核网络研发工程师第 三 届 e B P F 开 发 者 大 会自我介绍-邓德杨 字节跳动系统可观测技术专家 eBPF可观测、混沌工程、系统诊断、性能压测等产品负责人和架构师 10多年工作经验,毕业后先后就职于阿里巴巴、字节跳动等 先后从事网络、DevOps、混沌工程、可观测及故障诊断等系统研发工作背景第三届 eBPF开发者大会中国 西安第 三 届 e B P F 开 发 者 大 会背景-遇到挑战 图中显示的是微服务调用拓扑图,每时每刻都发生海量微服务相互调用。

2、在故障发生时,如何快速定位到故障原因,缩短MTTR(mean time to repair),成为一个很大的挑战。第 三 届 e B P F 开 发 者 大 会背景-遇到的问题 公司现有监控常见基于代码插桩或者SDK方式,实现数据采集 接入成本高 业务框架强耦合 覆盖率不全 链路断链第 三 届 e B P F 开 发 者 大 会背景-eBPF技术 基于eBPF 无侵入 高性能 可观测第 三 届 e B P F 开 发 者 大 会背景-字节业务需求 调用链路分析-延时高/异常的服务-诊断/Profiling-Root Cause 机房流量治理、容灾演练 解决存储服务多实例间调用黑盒问题 C+/P

3、ython等分布式服务调用链断链问题:框架推动难、性能损耗大 解决性能敏感的存储组件采集损耗高问题高性能可观测实践第三届 eBPF开发者大会中国 西安第 三 届 e B P F 开 发 者 大 会可观测-遇到的挑战 海量机器+海量微服务+海量数据 时间戳准确性 采集Pod的Id与服务映射及关联 性能瓶颈 业务多语言问题第 三 届 e B P F 开 发 者 大 会可观测-解决方案 可配置:采集+服务观测可动态配置 旁路解析:数据解析旁路处理,提升采集性能 多维度关联:服务 Id 和 Pod Id 关联 保留 Trace Id:使用 Trace Id+eBPF 采集,提升性能第 三 届 e B

4、P F 开 发 者 大 会可观测-系统架构第 三 届 e B P F 开 发 者 大 会可观测-数据采集 爆炸半径控制:perfevent+agent+eBPF 降低采集损耗:cgroup+netcls_id 分布式追踪:trace_id+ttheader/http header 提升性能:Agent旁路梳理数据 元数据关联:服务idpod id第 三 届 e B P F 开 发 者 大 会可观测-功能介绍 服务上下游异常分析 服务全局拓扑 可观测看板 分布式追踪拓扑 机房流量治理 可配置定制化采集 本产品主要基于eBPF能力,提供指标采集、网络分析、可观测、全链路分布式追踪、性能分析等能力,

5、并打通巡检、诊断、性能分析形成全链路解决方案第 三 届 e B P F 开 发 者 大 会可观测-实践案例-上下游链路分析 服务上下游异常指标排查 链路流量观测 可观测看板 可配置定制化采集第 三 届 e B P F 开 发 者 大 会可观测-实践案例-指标分析 出入流量时序图 网络丢包 网络重传 调用时延.采集实现原理第三届 eBPF开发者大会中国 西安杨腾腾:字节跳动内核网络研发工程师第 三 届 e B P F 开 发 者 大 会自我介绍-杨腾腾 字节跳动内核网络研发工程师 在内核网络领域具有丰富的经验,负责过多种网络产品的研发工作 深度参与eBPF在内核网络安全和网络可观测性项目第 三

6、届 e B P F 开 发 者 大 会实现原理-框架 配置下发至eBPF maps bpf prog hook tc 数据通过perf buffer上送 流量计数信息 TCP异常信息第 三 届 e B P F 开 发 者 大 会实现原理-TCP option 数据包携带TCP option sk_storage存储 提升性能 过滤项 五元组 源classid 目的classid 7层协议第 三 届 e B P F 开 发 者 大 会实现原理-7层协议推断 常规的7层协议推断方

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文介绍了字节跳动在海量微服务场景下,基于eBPF技术实现高性能可观测性的实践。关键点如下: 1. **挑战**:微服务间海量调用导致故障定位困难,传统监控手段存在接入成本高、覆盖率不全等问题。 2. **需求**:需解决调用链路分析、机房流量治理、分布式服务调用链断链等问题。 3. **解决方案**:利用eBPF无侵入、高性能特点,实现可配置的数据采集、旁路解析和多维度关联。 4. **系统架构**:通过perfevent、agent、eBPF等技术进行数据采集,降低采集损耗,提升性能。 5. **功能**:提供指标采集、网络分析、全链路追踪等服务,形成全链路解决方案。 6. **性能影响**:采集&可观测实践对基线性能影响为-2.74%,损耗较低。 综上,字节跳动通过eBPF技术优化了微服务的监控和故障诊断,有效提升了系统性能和可观测性。
"微服务海量调用,如何快速定位故障?" "字节跳动如何通过eBPF实现高性能可观测?" "如何降低监控对性能的影响?字节能这样做!"
客服
商务合作
小程序
服务号
折叠