kubernetes 使用基于 alpine 镜像无法正常解析外网DNS
May082018
【摘要】部署k8s时遇到了一个现象,在 kubernetes 中使用基于 alpine 镜像,启动后的pods解析内部kube-dns的域名没问题,但是外网域名的DNS均无法解析,
pods中可以ping通ip地址,分析了大半天,在dns上tcpdump抓包,发现3次握手不成功,alpine到dns的53端口不通…
逐步排除问题,首先排除了nodes网络问题,多个namespace的问题,kubernetes部署方式的问题,使用其他镜像均能正常解析DNS,发现问题应该是出在alpine镜像本身,alpine-3.5/3.6/3.7都有这个问题。alpine 这个小系统确实过于精简了,下面是问题出现的一些提示:
使用kubectl手动启动 alpine 测试解析域名失败:
1 2 3 4 5 |
# kubectl run appine-test -i -t --image=alpine:3.6 -- sh If you don't see a command prompt, try pressing enter. / # / # ping <a href="https://sudops.com">sudops.com</a> ping: bad address 'sudops.com' |
google之后有人提出要将/etc/resolv.conf中的ndots注释掉,于是在Dockerfile中的启动脚本中替换之。
1 |
sed -i 's/options ndots:5/#options ndots:5/g' /etc/resolv.conf |
这个命令pods运行起来后报错。
1 |
sed: can't move '/etc/resolv.confMdACPl' to '/etc/resolv.conf': Resource busy |
于是换个方式进行替换:
1 |
echo "$(sed 's/options ndots:5/#options ndots:5/g' /etc/resolv.conf)" > /etc/resolv.conf |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 |
# kubectl exec appine-test-6486s -n devopsnameserver -it -- /bin/bash bash-4.3# cat /etc/issue Welcome to Alpine Linux 3.6 Kernel \r on an \m (\l) bash-4.3# uname -a Linux kyphptest-6486s 3.10.0-693.21.1.el7.x86_64 #1 SMP Wed Mar 7 19:03:37 UTC 2018 x86_64 Linux bash-4.3# bash-4.3# bash-4.3# bash-4.3# cat /etc/resolv.conf nameserver 10.254.0.2 search devns.svc.cluster.local. svc.cluster.local. cluster.local. sudops.com #options ndots:5 再次ping # kubectl exec kyphptest-6486s -n devns -it -- /bin/bash bash-4.3# ping sudops.com PING sudops.com (123.125.115.110): 56 data bytes 64 bytes from 123.125.115.110: seq=0 ttl=51 time=2.987 ms 64 bytes from 123.125.115.110: seq=1 ttl=51 time=2.010 ms 64 bytes from 123.125.115.110: seq=2 ttl=51 time=1.924 ms ^C --- baidu.com ping statistics --- 3 packets transmitted, 3 packets received, 0% packet loss round-trip min/avg/max = 1.924/2.307/2.987 ms |
这样,alpine镜像里面终于可以解析了外网域名了。
本文固定链接: https://www.sudops.com/kubernetes-alpine-image-resolve-ext-dns.html | 运维·速度
哈哈,一起努力
2020-07-09 10:41谢谢, 给我很多启发. 我发现coredns开启autopath插件也会导致这个问题, 去掉可以解决.
2020-06-23 05:40