【问题标题】:What is the procedure to follow to restore Cassandra incremental backup when I have large number of files in backup directory当我在备份目录中有大量文件时,恢复 Cassandra 增量备份的过程是什么
【发布时间】:2020-11-20 03:12:35
【问题描述】:

我提出这个问题是因为我在 DataStax Docs 上没有看到任何具体的方法。

我在拍摄快照后启用了备份,现在我看到备份目录中有大约 20 万个文件。我不确定恢复它们的最佳方法是什么。

将它们全部复制到 Keyspace 表目录并执行 nodetool refresh <ks> <tbl> 但我认为它没有按预期工作并且它正在引发 StackOverflow 异常。 有没有办法解决这个问题?

我现在使用的是 16G Xmx。我在日志中看到一些错误,如下所示。这与 JVM 参数有关吗?

错误 [gbp-cass-49] [Reference-Reaper:1] 2020-07-29 18:49:01,704 Ref.java:223 - LEAK DETECTED: a reference (org.apache.cassandra.utils.concurrent. Ref$State@156d6370) 到类 org.apache.cassandra.utils.concurrent.WrappedSharedCloseable$Tidy@464162733:[Memory@[0..80), Memory@[0..a00)] 在引用之前没有被释放垃圾收集

nodetool refresh 在标准输出上抛出以下错误:

error: null
-- StackTrace --
java.lang.AssertionError
    at org.apache.cassandra.io.util.FileUtils.renameWithConfirm(FileUtils.java:178)
    at org.apache.cassandra.io.util.FileUtils.renameWithConfirm(FileUtils.java:173)
    at org.apache.cassandra.io.sstable.format.SSTableWriter.rename(SSTableWriter.java:273)
    at org.apache.cassandra.db.ColumnFamilyStore.loadNewSSTables(ColumnFamilyStore.java:714)
    at org.apache.cassandra.db.ColumnFamilyStore.loadNewSSTables(ColumnFamilyStore.java:658)
    at org.apache.cassandra.service.StorageService.loadNewSSTables(StorageService.java:4555)
    at sun.reflect.GeneratedMethodAccessor13.invoke(Unknown Source)
    at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
    at java.lang.reflect.Method.invoke(Method.java:497)
    at sun.reflect.misc.Trampoline.invoke(MethodUtil.java:71)
    at sun.reflect.GeneratedMethodAccessor9.invoke(Unknown Source)
    at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
    at java.lang.reflect.Method.invoke(Method.java:497)
    at sun.reflect.misc.MethodUtil.invoke(MethodUtil.java:275)
    at com.sun.jmx.mbeanserver.StandardMBeanIntrospector.invokeM2(StandardMBeanIntrospector.java:112)
    at com.sun.jmx.mbeanserver.StandardMBeanIntrospector.invokeM2(StandardMBeanIntrospector.java:46)
    at com.sun.jmx.mbeanserver.MBeanIntrospector.invokeM(MBeanIntrospector.java:237)
    at com.sun.jmx.mbeanserver.PerInterface.invoke(PerInterface.java:138)
    at com.sun.jmx.mbeanserver.MBeanSupport.invoke(MBeanSupport.java:252)
    at com.sun.jmx.interceptor.DefaultMBeanServerInterceptor.invoke(DefaultMBeanServerInterceptor.java:819)
    at com.sun.jmx.mbeanserver.JmxMBeanServer.invoke(JmxMBeanServer.java:801)
    at javax.management.remote.rmi.RMIConnectionImpl.doOperation(RMIConnectionImpl.java:1466)
    at javax.management.remote.rmi.RMIConnectionImpl.access$300(RMIConnectionImpl.java:76)
    at javax.management.remote.rmi.RMIConnectionImpl$PrivilegedOperation.run(RMIConnectionImpl.java:1307)
    at javax.management.remote.rmi.RMIConnectionImpl.doPrivilegedOperation(RMIConnectionImpl.java:1399)
    at javax.management.remote.rmi.RMIConnectionImpl.invoke(RMIConnectionImpl.java:828)
    at sun.reflect.GeneratedMethodAccessor12.invoke(Unknown Source)
    at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
    at java.lang.reflect.Method.invoke(Method.java:497)
    at sun.rmi.server.UnicastServerRef.dispatch(UnicastServerRef.java:323)
    at sun.rmi.transport.Transport$1.run(Transport.java:200)
    at sun.rmi.transport.Transport$1.run(Transport.java:197)
    at java.security.AccessController.doPrivileged(Native Method)
    at sun.rmi.transport.Transport.serviceCall(Transport.java:196)
    at sun.rmi.transport.tcp.TCPTransport.handleMessages(TCPTransport.java:568)
    at sun.rmi.transport.tcp.TCPTransport$ConnectionHandler.run0(TCPTransport.java:826)
    at sun.rmi.transport.tcp.TCPTransport$ConnectionHandler.lambda$run$241(TCPTransport.java:683)
    at sun.rmi.transport.tcp.TCPTransport$ConnectionHandler$$Lambda$177/1629407070.run(Unknown Source)
    at java.security.AccessController.doPrivileged(Native Method)
    at sun.rmi.transport.tcp.TCPTransport$ConnectionHandler.run(TCPTransport.java:682)
    at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1142)
    at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:617)
    at java.lang.Thread.run(Thread.java:745)

【问题讨论】:

    标签: cassandra cassandra-3.0 nodetool


    【解决方案1】:

    您的问题中确实没有足够的可操作信息来提供有意义的答案,但我会尽力做出回应。

    增量备份允许您将数据副本卸载到服务器外存储。然而,由于 Cassandra 将每个刷新的 memtable 硬链接到 backups/ 目录,它的内容可能会很快变得疯狂,因此您需要对其进行管理。这可以解释为什么您最终有 200K 备份。

    增量备份旨在与快照结合使用,快照相当于大多数人认为的传统意义上的完整备份。将快照视为类似于冷备份,将增量备份视为自上次快照以来的增量。

    这意味着每次在节点上拍摄快照时,都需要清除backups/目录中的增量备份。接下来,当您恢复增量备份时,您需要恢复相应的快照(也称为完整备份),然后应用增量备份(快照后的“增量”备份)。

    为了回应您提出的其他观点,您需要解释“我认为它没有按预期工作”的意思。此外,完整的错误消息和异常的完整堆栈跟踪是什么?为了做出有意义的诊断,而不是“它不起作用”,需要这种详细程度。

    您发布的错误可以忽略。这只是Reference-Reaper 线程成功找到孤立引用并将它们释放回池的消息。它确实应该记录在INFO 而不是ERROR 级别。

    我希望这会有所帮助。干杯!

    [编辑] 您在更新中发布给我的堆栈跟踪看起来您有文件系统权限问题。 C* 无法重命名文件,因此可能 (a) 拥有错误的所有权,(b) 不正确的权限,或 (c) 两者兼而有之。干杯!

    【讨论】:

    • 感谢您的回复。我不知何故错过了捕获nodetool 在屏幕上抛出的异常。但是当我执行 ```nodetool refresh `` 时它会处理 200K 文件吗?有什么想法吗?我会尽量重现并获得异常。
    • 请参考nodetool refresh 抛出的错误信息,并请告诉我您对解决问题的想法。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2015-08-29
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多