当前位置:首页 > 报告详情

分会场2_曾宇星_使用eBPF和Trace技术诊断Kubernetes下DNS问题_报告PPT.pdf

上传人: 科*** 编号:713398 2025-06-08 39页 4.38MB

1、使用eBPF和Trace技术诊断Kubernetes下DNS问题第三届 eBPF开发者大会w w w.e b p f t r a v e l.c o m中 国 西 安阿里云 曾宇星第 三 届 e B P F 开 发 者 大 会关于我Technical Expert,Alibaba Cloud Istio&Envoy member,has rich experiences in cloud native fields such as Kubernetes、Networking、Istio、Envoy、Nginx Ingress、CoreDNS,etc.曾宇星第 三 届 e B P F 开 发 者

2、 大 会 为什么DNS 问题难以排查 DNS问题常用排查方式 自动化诊断DNS问题目录为什么DNS问题难以排查 第三届 eBPF开发者大会w w w.e b p f t r a v e l.c o m中 国 西 安第 三 届 e B P F 开 发 者 大 会Kubernetes 下的DNS 解析链路第 三 届 e B P F 开 发 者 大 会Kubernetes 下的DNS 解析链路第 三 届 e B P F 开 发 者 大 会Kubernetes 下的DNS 解析链路复杂度:应用采用不同的语言实现,可能对应不同的DNS Resolver,dns 解析器的行为存在差异 本地的/etc/re

3、solv.conf 配置 IPVS/Iptabels 负载均衡和转发问题 CoreDNS 配置 CoreDNS 和上游DNS Server 间的网络问题第 三 届 e B P F 开 发 者 大 会Kubernetes 下DNS 常见问题应用侧DNS Resolver 的实现缺陷这只是其中一个例子:Musl lib 库的处理DNS 逻辑中,针对出现AAAA有NXDOMAIN时,整个域名都会被认为是无法正常解析的历史原因,不同的解析器不同版本可能存在一些已知问题(历史包袱)第 三 届 e B P F 开 发 者 大 会Kubernetes 下DNS 常见问题节点或者Ipvs、Iptables 问

4、题导致发送端丢包Error log write:operation not permitted第 三 届 e B P F 开 发 者 大 会Kubernetes 下DNS 常见问题IPVS 串流问题https:/ 三 届 e B P F 开 发 者 大 会Kubernetes 下DNS 常见问题 kube-proxy 异常导致ipvs 下对应的CoreDNS server 地址不同步第 三 届 e B P F 开 发 者 大 会Kubernetes 下DNS 常见问题CoreDNS 侧节点丢包第 三 届 e B P F 开 发 者 大 会Kubernetes 下DNS 常见问题CoreDNS

5、和 上游DnsServer 间的网络问题第 三 届 e B P F 开 发 者 大 会Kubernetes 下DNS 常见问题VPC 网络原因(路由、安全组配置等)DNS 问题常用的排查方式第三届 eBPF开发者大会w w w.e b p f t r a v e l.c o m中 国 西 安第 三 届 e B P F 开 发 者 大 会CoreDNS 内置的可观测相关插件插件类别名称Logginglog、dump、debug、dnstapTracingtrace(CoreDNS 内部)Metricsprometheus第 三 届 e B P F 开 发 者 大 会CoreDNS 内置的可观测相

6、关插件插件类别名称Logginglog、dump、debug、dnstapTracingtrace(CoreDNS 内部)Metricsprometheus第 三 届 e B P F 开 发 者 大 会查看CoreDNS 日志-Log Plugin仅提供CoreDNS 侧看到的信息INFO 10.0.3.105:44074-15790 AAAA IN 12fe2448f5b-.udp 75 false 1232 NOERROR qr,rd,ra 161 0.000328346sClient IPQuery IDResponse CodeResponse Duration第 三 届 e B P

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要讲述了在Kubernetes下,利用eBPF和Trace技术诊断DNS问题的难点、常用排查方法及自动化诊断工具。关键点如下: 1. DNS问题诊断难点:Kubernetes下的DNS解析链路复杂,涉及应用语言多样性、本地配置、IPVS/Iptables问题及CoreDNS配置等。 2. 常用排查方式:CoreDNS内置的可观测相关插件(如Logging、Tracing、Metrics),以及排查工具(如dig/nslookup、dnstap、Hubble、KubeSkoop等)。 3. 自动化诊断工具:针对ACK(阿里云容器服务 Kubernetes 版)的DNS自动化诊断工具,包含三类eBPF程序(socket、kprobe、tracepoint),可快速定位问题。 案例1:通过自动化诊断工具发现,DNS请求发送了30个请求,但CoreDNS侧仅收到14个。 案例2:自动化诊断工具揭示了CoreDNS对特定域名的延迟响应问题。 文章以丰富的排查经验和实际案例展示了自动化诊断工具在处理复杂DNS问题时的优势。
"K8s DNS诊断难题如何破?" "eBPF技术如何高效定位DNS问题?" "一键诊断工具,解决DNS偶发失败?"
客服
商务合作
小程序
服务号
折叠