【发布时间】:2020-01-07 07:36:10
【问题描述】:
我正在开展一个项目,我们使用 ZFS 作为存储卷管理器。在 ZFS 之上,一个 ISCSI tgt 守护程序正在运行并将 ZFS 设备公开为 SCSI 磁盘。现在的问题是 ZFS 高可用性。实际上,ZFS 不能集群。下面的解决方案有一些问题,这就是我避免使用它们的原因。
https://github.com/ewwhite/zfs-ha/wiki:需要服务器在故障转移期间启动以导出 zpools 元数据
-
使用快照:快照适用于备份,但不适合高可用性。事实上,我在故障转移期间丢失了数据,因为这两个池不同步。 (第二个池只有最后一个快照之前第一个服务器死了,所有写入的数据之后快照是在故障转移丢失之前)
有没有办法通过使 ZFS 池高可用来使这些 SCSI 磁盘高可用?在 ZFS 之上添加集群文件系统是否有意义?
【问题讨论】:
-
ZFS 不能集群 不是真的。 ZFS 可以像任何其他非共享文件系统一样进行集群 - 一次将共享“磁盘”(实际上是一个 SCSI LUN)安装在集群的任何一台主机上。 ZFS 池 NOT 必须导出才能进行故障转移 - 只需使用
zfs import -f ...进行强制导入。然后,困难的部分是以不尝试导入池的方式恢复发生故障的服务器。最简单的方法是从字面上将其从用于访问 ZFS 池的网络中拔出。这种恢复必须是手动的,所以你不想经常这样做。 -
有趣...你最后做了什么?
标签: storage cluster-computing high-availability zfs