【问题标题】:CoreOS after some reboot can't load etcd unit with user_data config重启后CoreOS无法使用user_data配置加载etcd单元
【发布时间】:2014-09-19 14:33:47
【问题描述】:

我正在尝试使用 cloud-config 安装在磁盘上的 CoreOS(版本 410.0.0 稳定版)。首次启动时一切正常,但经过几天和一些重新启动后,etcd 出现了问题。

当我启动机器时,输出会生成如下消息:

Failed to start Load cloud-config from  /var/

<some output lines>

Failed to start Login service

然后当我尝试登录有效用户时,控制台输出它是:

CoreOS(stable)
Failed Units: 1
   user-cloudinit@var-lib-coreos\x2install-user_data.service
devops@deis-server2~$

此时系统已唤醒,但 etcd 未注册到 cloud-config 上的 discovery url

有人知道这个问题吗?并且因为在重新启动后发生?

【问题讨论】:

    标签: reboot coreos deis


    【解决方案1】:

    我在@crawford 的帮助下解决了这个问题。应用了一些步骤:

    1. /var/lib/coreos-install/user_data 中删除主机名和发现行
    2. 删除目录/var/lib/etcd
    3. 重启系统

    然后,一切正常。再次感谢@crawford

    【讨论】:

    • 看来我每次重新启动系统时都必须执行第 2 步和第 3 步。你的现在还没有重置吗?
    • @BryanLarsen 很抱歉,您的问题不清楚,如果您需要通过 irc 聊天,请添加更多详细信息或告诉我
    • 我只是想知道您的服务器现在是否可以正确重启而没有问题?除非我在每次重新启动之前执行rm -rf /var/lib/etcd,否则我会得到与您在问题中列出的相同的控制台输出。
    • ohh..well [这里][github.com/coreos/bugs/issues/146] 是关于这个主题的问题,它还没有解决。目前我没有使用 CoreOS,但我记得当服务器出现该错误而不是每次重新启动时都必须删除一些东西。您可以联系 pepe 以获取更多信息或关注所引用的问题。
    • 记得检查你的CoreOS版本,因为我在一个月前发布了这个问题
    【解决方案2】:

    随着时间的推移,随着机器的来来去去,发现 URL 最终将包含不再存在的对等点的地址。 发现 URL 中的每个条目的 TTL 为 7 天

    发现 URL 也可能不包含现有地址,因为它们在 7 天后全部被删除。这表示一个死集群,发现 URL 将不再起作用,应该被丢弃。

    欲了解更多信息:https://coreos.com/docs/cluster-management/setup/cluster-discovery/#existing-clusters

    【讨论】:

    • 这是什么意思?这意味着我们不能在 7 天后重新启动节点?
    • 是的,有时您现有的地址可以在 7 天后全部删除,并且您无法重新启动子节点
    猜你喜欢
    • 2018-09-11
    • 2020-06-03
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2015-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多