【问题标题】:Membase node fault handeling in JavaJava中的Membase节点故障处理
【发布时间】:2011-06-15 15:13:11
【问题描述】:

我正在寻找一个 java 示例,该示例显示如何在 Membase 的一个节点出现故障时避免异常。

我有一个由两个节点组成的小集群,带有一个“默认”存储桶。它在两台服务器上复制。我为压力加载编写了一个小的 java 测试应用程序。我使用 spymemcache 2.7。当我运行它时 - 两台服务器都很忙。当我关闭一个 membase 实例时,我的 java 应用程序崩溃了。

这里是异常日志:

2011-06-15 17:32:33.405 INFO net.spy.memcached.MemcachedConnection:  Added {QA sa=/192.168.1.9:11211, #Rops=0, #Wops=0, #iq=0, topRop=null, topWop=null, toWrite=0, interested=0} to connect queue
2011-06-15 17:32:33.407 INFO net.spy.memcached.MemcachedConnection:  Added {QA sa=/192.168.1.10:11211, #Rops=0, #Wops=0, #iq=0, topRop=null, topWop=null, toWrite=0, interested=0} to connect queue
2011-06-15 17:32:33.412 INFO net.spy.memcached.MemcachedConnection:  Connection state changed for sun.nio.ch.SelectionKeyImpl@63238bd2
2011-06-15 17:32:33.413 INFO net.spy.memcached.MemcachedConnection:  Connection state changed for sun.nio.ch.SelectionKeyImpl@37bd2664
2011-06-15 18:20:21.896 INFO net.spy.memcached.MemcachedConnection:  Reconnecting due to exception on {QA sa=/192.168.1.9:11211, #Rops=2, #Wops=0, #iq=0, topRop=net.spy.memcached.protocol.binary.StoreOperationImpl@5f4275d4, topWop=null, toWrite=0, interested=1}
java.io.IOException: Connection reset by peer
    at sun.nio.ch.FileDispatcher.read0(Native Method)
    at sun.nio.ch.SocketDispatcher.read(SocketDispatcher.java:21)
    at sun.nio.ch.IOUtil.readIntoNativeBuffer(IOUtil.java:237)
    at sun.nio.ch.IOUtil.read(IOUtil.java:210)
    at sun.nio.ch.SocketChannelImpl.read(SocketChannelImpl.java:236)
    at net.spy.memcached.MemcachedConnection.handleReads(MemcachedConnection.java:487)
    at net.spy.memcached.MemcachedConnection.handleIO(MemcachedConnection.java:427)
    at net.spy.memcached.MemcachedConnection.handleIO(MemcachedConnection.java:280)
    at net.spy.memcached.MemcachedClient.run(MemcachedClient.java:2063)
2011-06-15 18:20:21.897 WARN net.spy.memcached.MemcachedConnection:  Closing, and reopening {QA sa=/192.168.1.9:11211, #Rops=2, #Wops=0, #iq=0, topRop=net.spy.memcached.protocol.binary.StoreOperationImpl@5f4275d4, topWop=null, toWrite=0, interested=1}, attempt 0.
2011-06-15 18:20:21.898 WARN net.spy.memcached.protocol.binary.BinaryMemcachedNodeImpl:  Discarding partially completed op: net.spy.memcached.protocol.binary.StoreOperationImpl@5f4275d4
2011-06-15 18:20:21.899 WARN net.spy.memcached.protocol.binary.BinaryMemcachedNodeImpl:  Discarding partially completed op: net.spy.memcached.protocol.binary.GetOperationImpl@802b249
Exception in thread "main" java.lang.RuntimeException: Exception waiting for value
    at net.spy.memcached.MemcachedClient.get(MemcachedClient.java:1146)
    at net.spy.memcached.MemcachedClient.get(MemcachedClient.java:1163)

我让节点 192.168.1.9 宕机,但客户端不理解并崩溃。

任何想法如何正确处理它?

【问题讨论】:

    标签: java memcached membase


    【解决方案1】:

    -如果您对服务器进行故障转移,异常会消失吗? - 您将客户端指向哪个服务器的 URI?如果您将其指向“另一个”一个和/或两者,会有所不同吗?

    佩里

    【讨论】:

      【解决方案2】:

      我认为这不是因为 memcached 集群,因为我在本地运行单个 memcached 服务器并运行测试用例以缓存和检索数据时收到此错误消息。以下环境正在使用 mac snow jumpord + spymemcached 2.7 + memcached 1.4.6

      我在守护程序模式下运行它,在我重新启动本地 memcached 服务器后它得到了修复。

      很抱歉,我无法准确说出造成这种情况的原因,但执行上述操作解决了问题。

      【讨论】:

      • 嗨 Bobby,我的问题与 memcache 无关,它与 membase 有关。但感谢您分享您的经验。
      【解决方案3】:

      所以,我们没有找到问题的答案,我们不再使用这个软件了。现在我们使用 Erlang 绝对可以满足这种内存数据存储的需求。

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 2018-06-09
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        相关资源
        最近更新 更多