【发布时间】:2010-10-18 15:02:58
【问题描述】:
我在 Linux 上的一个项目使用阻塞套接字。事情是连续发生的,所以非阻塞只会让事情变得更复杂。无论如何,我发现recv() 调用经常返回-1,而errno 设置为EAGAIN。
man 页面只真正提到了非阻塞套接字的这种情况,这是有道理的。使用非阻塞,套接字可能可用也可能不可用,因此您可能需要重试。
什么会导致阻塞套接字发生这种情况?我能做些什么来避免它吗?
目前,我处理它的代码看起来像这样(我让它在出错时抛出异常,但除此之外,它是一个非常简单的 recv() 包装器):
int ret;
do {
ret = ::recv(socket, buf, len, flags | MSG_NOSIGNAL);
} while(ret == -1 && errno == EAGAIN);
if(ret == -1) {
throw socket_error(strerror(errno));
}
return ret;
这是否正确?EAGAIN 条件经常被命中。
编辑:我注意到的一些可能相关的事情。
我确实使用
setsockopts()在套接字上设置了读取超时,但它设置为 30 秒。EAGAIN的发生频率超过每 30 秒一次。 更正我的调试存在缺陷,EAGAIN的发生频率并没有我想象的那么频繁。可能是超时触发。-
为了连接,我希望能够有连接超时,所以我暂时将套接字设置为非阻塞。该代码如下所示:
int error = 0; fd_set rset; fd_set wset; int n; const SOCKET sock = m_Socket; // set the socket as nonblocking IO const int flags = fcntl (sock, F_GETFL, 0); fcntl(sock, F_SETFL, flags | O_NONBLOCK); errno = 0; // we connect, but it will return soon n = ::connect(sock, addr, size_addr); if(n < 0) { if (errno != EINPROGRESS) { return -1; } } else if (n == 0) { goto done; } FD_ZERO(&rset); FD_ZERO(&wset); FD_SET(sock, &rset); FD_SET(sock, &wset); struct timeval tval; tval.tv_sec = timeout; tval.tv_usec = 0; // We "select()" until connect() returns its result or timeout n = select(sock + 1, &rset, &wset, 0, timeout ? &tval : 0); if(n == 0) { errno = ETIMEDOUT; return -1; } if (FD_ISSET(sock, &rset) || FD_ISSET(sock, &wset)) { socklen_t len = sizeof(error); if (getsockopt(SOL_SOCKET, SO_ERROR, &error, &len) < 0) { return -1; } } else { return -1; } done: // We change the socket options back to blocking IO if (fcntl(sock, F_SETFL, flags) == -1) { return -1; } return 0;
我的想法是我将它设置为非阻塞,尝试连接并在套接字上选择,以便我可以强制超时。 set 和 restore fcntl() 调用都成功返回,所以当这个函数完成时,套接字应该再次进入阻塞模式。
【问题讨论】: