【发布时间】:2020-10-24 16:27:11
【问题描述】:
我能够创建 EKS 集群,但是当我尝试添加节点组时,我收到“创建失败”错误,其中包含详细信息: “NodeCreationFailure”:实例加入kubernetes集群失败
我尝试了多种实例类型并增加了更大的卷大小 (60gb),但运气不佳。 查看 EC2 实例,我只看到以下问题。但是,由于我没有直接启动 EC2 实例(EKS NodeGroup UI 向导正在这样做),因此很难做任何事情。
如果在我可以跳入 ec2 机器并“修复”它们之前发生故障,人们将如何前进?
亚马逊 Linux 2
x86_64 上的内核 4.14.198-152.320.amzn2.x86_64
ip-187-187-187-175 登录:[54.474668] cloud-init[3182]:其中之一 配置的存储库失败(未知), [54.475887] cloud-init [3182]:yum 没有足够的缓存 数据继续。此时唯一 [ 54.478096] cloud-init [3182]:yum 可以做的安全事情是失败。那里 有几种方法可以“解决”这个问题: [54.480183] cloud-init[3182]:1.联系上游获取 存储库并让他们解决问题。 [54.483514] cloud-init[3182]:2.重新配置baseurl/etc。为了 存储库,指向一个工作 [54.485198]云初始化[3182]:上游。这通常很有用 如果您使用的是较新的 [54.486906] cloud-init [3182]:发行版比现在 由存储库(和 [54.488316] cloud-init [3182]:前一个包 发行版仍然有效)。 [54.489660] cloud-init [3182]:3.运行命令 存储库暂时禁用 [54.491045]云初始化[3182]:百胜--disablerepo = ... [54.491285] cloud-init [3182]:4.禁用存储库 永久,所以默认情况下 yum 不会使用它。百胜 [54.493407] cloud-init [3182]:然后将忽略存储库 直到您永久启用它 [54.495740] cloud-init [3182]:再次或使用--enablerepo for 临时使用: [54.495996] cloud-init [3182]:yum-config-manager --disable
【问题讨论】:
-
您是否将实例部署到没有 NAT 网关的私有 VPC(无法访问互联网)?
-
您是否尝试过使用 eksctl 添加节点?
-
@paltaa 好点。 eksctl 效果很好(表明权限不是问题),但是 eksctl 还不允许 v1.18,所以我不得不改用 UI 和/或 aws cli
标签: amazon-web-services kubernetes amazon-ec2 amazon-eks