【发布时间】:2020-04-25 23:04:08
【问题描述】:
这种情况每周发生一次或两次,无需应用任何命令。我刚刚收到许多 pod 已关闭的警报。
至少 40 天前创建的集群设置:
gcloud container \
clusters create "yourclustername" \
--project "yourprojectname" \
--zone "yourregion-zone" \
--no-enable-basic-auth \
--release-channel "regular" \
--machine-type "e2-standard-2" \
--image-type "COS" \
--disk-type "pd-ssd" \
--disk-size "20" \
--metadata disable-legacy-endpoints=true \
--scopes "https://www.googleapis.com/auth/devstorage.read_only","https://www.googleapis.com/auth/logging.write","https://www.googleapis.com/auth/monitoring","https://www.googleapis.com/auth/servicecontrol","https://www.googleapis.com/auth/service.management.readonly","https://www.googleapis.com/auth/trace.append" \
--num-nodes "2" \
--enable-stackdriver-kubernetes \
--enable-ip-alias \
--network "projects/yourprojectname/global/networks/yournetwork" \
--subnetwork "projects/yourprojectname/regions/yourregion/subnetworks/yournetwork" \
--default-max-pods-per-node "110" \
--enable-autoscaling \
--min-nodes "2" \
--max-nodes "4" \
--no-enable-master-authorized-networks \
--addons HorizontalPodAutoscaling,HttpLoadBalancing,NodeLocalDNS,ApplicationManager \
--enable-autoupgrade \
--enable-autorepair \
--max-surge-upgrade 1 \
--max-unavailable-upgrade 0 \
--enable-shielded-nodes
节点条件:
我删除了出现此错误的 pod,GKE 创建了另一个,当然这不是解决方案,至少需要 4 分钟的停机时间。如何解决这个问题?即使在 GKE 上,我也需要像印花布或法兰绒这样的东西吗?
【问题讨论】:
-
是的,您的集群需要一个网络插件。
-
相关:KUBEADM-1031 - 使用 ''' kubectl apply -f raw.githubusercontent.com/coreos/flannel/master/Documentation/… ''' 修复
-
您好,您是否尝试过应用 Iñigo 推荐的修复程序?让我们知道!
-
您好@willrof,我今天启用了 Calico (docs.projectcalico.org/getting-started/kubernetes/…),因为 GKE 内置了对它的支持 (cloud.google.com/kubernetes-engine/docs/how-to/network-policy)。我们将在这周看到一切是否正常。
标签: docker kubernetes google-kubernetes-engine