【发布时间】:2021-11-06 19:41:13
【问题描述】:
我有一个由 6 个节点组成的 elastiсsearch 集群。 每天创建 5 个索引(每个索引消耗大约 10 到 250 GB) 我们现在有一个快照存储库(位于 NFS 共享上),这些索引每天都会在其中备份,但事实是,在一年内,这个快照存储库开始重达 40 TB,而事实是这些是支付日志法律要求在我的国家/地区存储 2 年,但我们在 NFS 上没有那么多空间,当 NFS 共享出现错误并且我们的快照存储库被损坏并且我们无法恢复它时,我们发生了一个事件 然后我想改变备份过程,制作一个每天都会出现的脚本
- 在 NFS 共享上创建一个具有当前日期的新文件夹 (logz-backup-Year-Month-Day)
- 将快照存储库注册到此文件夹
- 拍摄快照
- 从 elasticsearch 中删除快照存储库
- 从文件夹中存档
但问题是每次备份到新的快照存储库时,Elasticsearch 都会对内容进行完整备份,我怎样才能使弹性搜索只将新索引备份到新的快照存储库?我听说过https://www.elastic.co/guide/en/cloud/current/ec-getting-started-profiles-hot-warm.html,是否可以在前 24 小时内(用于备份)做一些索引很热的事情,如果它早于一天,它们就会切换到温暖状态,这样它们就不会被备份到新快照存储库? P.S 我尝试使用 gzip 压缩我的 elasticsearch 存储库文件夹,并且得到了明显的压缩(从 40 TB 到原来是 20 TB)
【问题讨论】:
标签: elasticsearch devops