kubernetes 坑人的错误!!!Unable to connect to the server: x509: certificate signed by unknown authority
说明
尼玛,今晚在虚拟机搭建 kubernetes 集群环境时,遇到一个破问题,我花费了近4个小时才解决!!!现记录下这个问题如何出现以及如何解决,避免后人踩坑!!!
环境
- ubuntu 16.04 虚拟机
- docker 18.09.1
- kubernetes 1.14.3
问题复现
昨天按照教程搭建了一个集群,今天想重新实验下,于是执行kubeadm reset
命令清除集群所有的配置。
接着按照部署的常规流程执行kubeadm init --kubernetes-version=v1.14.3 --pod-network-cidr=10.244.0.0/16 --apiserver-advertise-address=0.0.0.0
命令创建集群。然后执行以下几个命令:
mkdir -p $HOME/.kube
sudo cp -i /etc/kubernetes/admin.conf $HOME/.kube/config
sudo chown $(id -u):$(id -g) $HOME/.kube/config
接着当我执行kubectl get nodes
等命令时,所有的命令都会打印出错误:Unable to connect to the server: x509: certificate signed by unknown authority (possibly because of “crypto/rsa: verification error” while trying to verify candidate authority certificate “kubernetes”)
当在这些 kubectl 命令后加入 --insecure-skip-tls-verify 参数时,就会报如下错误:error: You must be logged in to the server (Unauthorized)
问题解决过程
期间,我尝试了所有能搜索的相关资料,都没有一个好使的。我还确认了kubeadm reset
命令会完全清除已创建的集群配置,那么为什么清配置后重新创建集群却不行呢?实在没办法我把注意力集中到额外执行的这几个命令上:
mkdir -p $HOME/.kube
sudo cp -i /etc/kubernetes/admin.conf $HOME/.kube/config
sudo chown $(id -u):$(id -g) $HOME/.kube/config
这几个命令会创建一个目录,并复制几个配置文件,重新创建集群时,这个目录还是存在的,于是我尝试在执行这几个命令前先执行rm -rf $HOME/.kube
命令删除这个目录,最后终于解决了这个问题!!!
总结
这个问题很坑人,删除集群然后重新创建也算是一个常规的操作,如果你在执行 kubeadm reset
命令后没有删除创建的 $HOME/.kube
目录,重新创建集群就会出现这个问题!
更多推荐
所有评论(0)