【问题标题】:socket, detect connection is lost套接字,检测连接丢失
【发布时间】:2011-05-19 17:27:04
【问题描述】:

我正在通过 TCP 连接连接服务器进程和客户端进程,我必须检测
两台机器之间的物理连接已断开。我正在尝试使用 keepalive 来做到这一点,
将默认系统范围的值降低到:

TCP_KEEPIDLE=5
TCP_KEEPCNT = 5
TCP_KEEPINTVL = 1

当连接断开(我断开电缆)时,只有服务器在 10 秒内检测到连接已丢失,客户端就挂在发送上。

这是客户端代码:

#include <iostream>
#include <string.h>
#include <sys/socket.h>
#include <stdlib.h>
#include <arpa/inet.h>
#include <errno.h>
#include <netinet/tcp.h>

int main(int argc, char** argv) {
  char myVector[1600];

  int mySocket = socket(AF_INET, SOCK_STREAM, IPPROTO_IP);
  if (mySocket < 0 ) {
    std::cout << "error creating the socket" << strerror(errno) << std::endl;
    ::exit(-1);
 }

 struct sockaddr_in sin;
 memset( (char *)&sin, 0, sizeof( sin ) );
 sin.sin_addr.s_addr = inet_addr("192.168.21.27");
 sin.sin_port   = htons(7788);
 sin.sin_family = AF_INET;

 if ( connect( mySocket, (struct sockaddr *)&sin, sizeof( sin )) < 0 ) {
   std::cout << "Error on connection: " << strerror(errno) << std::endl;
   ::exit(-1);
 }

 int optval = 1;
 socklen_t optlen = sizeof(optval);

 /*Enabling keep alive*/
 if(setsockopt(mySocket, SOL_SOCKET, SO_KEEPALIVE, &optval, optlen) < 0) {
   std::cout << "Error setting SO_KEEPALIVE: " << strerror(errno) << std::endl;
 }

 optval = 5;
 optlen = sizeof(optval);
 if(setsockopt(mySocket, SOL_TCP, TCP_KEEPIDLE, &optval, optlen) < 0) {
    std::cout << "Error setting TCP_KEEPIDLE: " << strerror(errno) << std::endl;
 }

 optval = 5;
 optlen = sizeof(optval);
 if(setsockopt(mySocket, SOL_TCP, TCP_KEEPCNT, &optval, optlen) < 0) {
   std::cout << "Error setting TCP_KEEPCNT: " << strerror(errno) << std::endl;
 }

 optval = 1;
 optlen = sizeof(optval);
 if(setsockopt(mySocket, SOL_TCP, TCP_KEEPINTVL, &optval, optlen) < 0) {
   std::cout << "Error setting TCP_KEEPINTVL: " << strerror(errno) << std::endl;
 }

 for (;;) {
   ssize_t myRet= ::send(mySocket,
                                      myVector,
                                      sizeof(myVector),
                                     0);
   if (myRet < 0) {
     std::cout << "Error: " << strerror(errno) << std::endl;
     break;
   }
   std::cout << myRet << "."; std::cout.flush();
   sleep(1);
 }
}

我确定我错过了什么,但是什么?

【问题讨论】:

    标签: c++ c sockets


    【解决方案1】:

    TCP Keepalive 不适用于此用途。

    如果您想在应用层检测中断,请执行 SSH、IMAP 和 IRC 等协议的工作 - 在应用层实现 echo/ping 类型的消息。定期发送它们,如果您没有得到及时回复,则可以认为连接已断开。

    【讨论】:

    • 嗯。但它的用途是什么?
    • @vines:它允许最终检测并清除长期存在的陈旧连接 - 在及时性并不重要的情况下。
    【解决方案2】:

    不久前我们在公司里想知道这个问题:“如何检测连接中断?”。 为了可靠地解决这个问题,我们必须实现一个“心跳”系统,即客户端通过执行伪 ping 定期检查(在我们的例子中是每秒)服务器是否仍然存在。 如果您不想这样做,您可以等待操作系统实际检测到该连接已断开,但不要指望它是可靠的...

    【讨论】:

    • @Gaetano,我很惊讶你有保持活动的机制,坦率地说,即使对于服务器也是如此。正如 Mikarnage 指出的那样,心跳系统是所有平台和 IP 堆栈实现(无论如何都是 AFAIK)唯一真正可靠的机制。
    【解决方案3】:

    所以, 经过进一步调查,即使“TCP Keepalive”不打算用于此用途,我发现保持活动探测已开始在“空闲连接”上发送。现在的问题是:“何时认为连接处于空闲状态?”。 当没有数据“正在传输”时,连接被认为是空闲的,因此如果其中一个 两个对等方在 send(...) 上被阻塞,实际上有一些数据正在传输,并且连接不被认为是空闲的。我想我现在唯一的选择是使用带超时的发送/接收进行 ping/pong,当这些计时器到期时声明连接“丢失”。

    【讨论】:

    • 我不完全确定,但我认为,这一行解释了(在 Linux 环境中)为什么使用 send() 时 keepalive 不起作用:tcp_timer.c
    【解决方案4】:

    Gaetano、IMO、TCP keep-alives 可用于检测死连接。在您的示例中,客户端可能实际上挂在发送中,等待 TCP 重试耗尽自己。根据退避算法和 TCP 堆栈状态机,这可能会持续几分钟而无需任何 keep-alive 探测,因此无法耗尽 keepcnt。

    我假设服务器大部分是读阻塞的,在这种情况下,它的 keep-alives 将每 keepidle/slowhz 秒发送一次(slowhz 通常是 2 而不是 1),它会很快检测到连接丢失.

    如果您使用 tcpdump 捕获数据包跟踪,您将确切地看到线路上发生了什么。

    【讨论】:

      【解决方案5】:

      您应该将SOL_TCP 替换为IPPROTO_TCP
      有关更多信息,请点击这些链接

      【讨论】:

        猜你喜欢
        • 2012-08-18
        • 1970-01-01
        • 1970-01-01
        • 2018-09-26
        • 2016-09-04
        • 2011-06-13
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        相关资源
        最近更新 更多