【问题标题】:How does this code from "Network programming" examples work?“网络编程”示例中的这段代码如何工作?
【发布时间】:2011-02-18 13:36:42
【问题描述】:

我正在阅读 Beej 的“Guide to network programming”。

在他的一个介绍性示例中,他谈到了获取主机名的 IP 地址(例如 google.com 或 yahoo.com)。 这是代码。

/*
** showip.c -- show IP addresses for a host given on the command line
*/

#include <stdio.h>
#include <string.h>
#include <sys/types.h>
#include <sys/socket.h>
#include <netdb.h>
#include <arpa/inet.h>

int main(int argc, char *argv[])
{
    struct addrinfo hints, *res, *p;
    int status;
    char ipstr[INET6_ADDRSTRLEN];

    if (argc != 2) {
        fprintf(stderr,"usage: showip hostname\n");
        return 1;
    }

    memset(&hints, 0, sizeof hints);
    hints.ai_family = AF_UNSPEC; // AF_INET or AF_INET6 to force version
    hints.ai_socktype = SOCK_STREAM;

    if ((status = getaddrinfo(argv[1], NULL, &hints, &res)) != 0) {
        fprintf(stderr, "getaddrinfo: %s\n", gai_strerror(status));
        return 2;
    }

    printf("IP addresses for %s:\n\n", argv[1]);

    for(p = res; p != NULL; p = p->ai_next) {
        void *addr;
        char *ipver;

        // get the pointer to the address itself,
        // different fields in IPv4 and IPv6:
        if (p->ai_family == AF_INET) { // IPv4
            struct sockaddr_in *ipv4 = (struct sockaddr_in *)p->ai_addr;
            addr = &(ipv4->sin_addr);
            ipver = "IPv4";
        } else { // IPv6
            struct sockaddr_in6 *ipv6 = (struct sockaddr_in6 *)p->ai_addr;
            addr = &(ipv6->sin6_addr);
            ipver = "IPv6";
        }

        // convert the IP to a string and print it:
        inet_ntop(p->ai_family, addr, ipstr, sizeof ipstr);
        printf("  %s: %s\n", ipver, ipstr);
    }

    freeaddrinfo(res); // free the linked list

    return 0;
}

让我困惑的部分是 for 循环。

for(p = res; p != NULL; p = p->ai_next) {
    void *addr;
    char *ipver;

    // get the pointer to the address itself,
    // different fields in IPv4 and IPv6:
    if (p->ai_family == AF_INET) { // IPv4
        struct sockaddr_in *ipv4 = (struct sockaddr_in *)p->ai_addr;
        addr = &(ipv4->sin_addr);
        ipver = "IPv4";
    } else { // IPv6
        struct sockaddr_in6 *ipv6 = (struct sockaddr_in6 *)p->ai_addr;
        addr = &(ipv6->sin6_addr);
        ipver = "IPv6";
    }

    // convert the IP to a string and print it:
    inet_ntop(p->ai_family, addr, ipstr, sizeof ipstr);
    printf("  %s: %s\n", ipver, ipstr);
}

有没有人介意一步一步地通过伪程序来了解正在发生的事情或这些事情是什么?它是遍历链表吗?.. 我大致了解 struct addrinfo 是什么,但到底是什么 struct *resstruct *pvoid *addr*char ipversion

【问题讨论】:

  • 关于"} else { // IPv6:在大多数实际情况下应该没问题,但我不喜欢它作为教学样本;它给出了错误的想法。套接字支持除 IP(4) 和 IPv6 之外的协议,以及除 AF_INET 和 AF_INET6 (IPv6) 之外的 ai_family 值。事实上,我确信 AF_INET6 是迄今为止最新添加到列表中的。至少,我可能会发表更广泛的评论。

标签: c sockets network-programming


【解决方案1】:

第一件事是第一,你知道linked list 是什么吗?如果你理解了这一点,你就会知道那个 for 循环是怎么回事。 p 是一个指向结构的指针,该结构还引用(链接)列表中的下一个结构。因此,您正在遍历这些结构的列表,它们是addrinfo 结构。 4

现在,关于网络数据包,您需要了解的是它们由标头组成。特别是Ethernet frame。这是硬件到硬件的协议。它可以让您在物理的、有界的网络上处理事情,但对跨物理网络边界的路由一无所知。

接下来是tcp 或者可能是另一个传输层协议,它位于两个级别之间的某个位置。 TCP 与 UDP 与 X 是关于您如何管理数据包 - 例如 TCP 要求数据包按顺序重新组合,而 UDP 是“广播”类型的协议。

最后,您拥有了互联网协议套件(IPv4、IPv6)。这些是控制更广泛意义上的路由的更高级别的协议,因此它们了解整个互联网,但不太了解到达那里所需的步骤。

一个很好的解释是这个page 上的方便图。综上所述,BGP 是路由器知道如何移动东西的方式。

tcp/udp 通过成为相关协议(例如 IPv4)的一部分(封装在其中)来适应这张图片

因此,以太网帧包含其他协议,尤其是 IPv4,其中包含路由器通过 Internet(跨多个物理网络)获取它所需的信息。 internet 协议指定您想去哪里,从哪里来。因此,典型的 IPv4 主体在其整个传输过程中保持不变,但每次遍历物理网络时,它都会被包裹在不同的以太网数据包中。

现在,在以太网标头中有一个字段用于找出“以太网主体”包含的内容。这一行:

 if (p->ai_family == AF_INET) {

确实。 AF_INET 是一个常量,它与 tcp 用于将数据包主体标识为 IPv4 的值相匹配。因此,如果您正在查看 IPv4 标头,则此循环会继续读取该信息。

else 子句在技术上是错误的,因为不是 IPv4 不会自动使其成为 IPv6。您可以将其更改为像这样测试 IPv6:

 else if (p->ai_family == AF_INET6) { 

你可能想做的,以防万一你拿起别的东西。

现在有必要解释一下这个魔法了:

struct sockaddr_in6 *ipv6 = (struct sockaddr_in6 *)p->ai_addr;

这基本上采用以字节序列形式出现的数据的网络或原始形式,并将其转换(转换)到结构中的字段中。因为您知道这些字段将有多大,所以这是提取所需内容的一种非常快速且简单的方法。

最后需要解释的是:

inet_ntop(p->ai_family, addr, ipstr, sizeof ipstr);

还有其他方法可以实现这一点,特别是ntohs()

基本上网络数据以大端编码传输,为了读取它,您需要(可能)将数据转换为系统的编码。它可能是大端,也可能是小端,这在很大程度上取决于您的系统。阅读endianness 上的维基百科文章。

总结:您在这里看到的是计算机科学结构、网络如何工作和 C 代码的组合。

【讨论】:

  • 当,很好的解释!谢谢。这正是我想要的!要是每本书都这么描述就好了
  • 我在一份旧工作中学到了所有这些——我基本上必须重新设计一小部分 tcpdump...如果你有时间研究他们的代码库,它会教你一切你曾经想知道那里的每一个网络协议......
【解决方案2】:

嗯,没那么复杂。 getaddrinfo 返回addrinfo 结构的链接列表(手册页中的struct addrinfo **res),其中每个结构都包含有关给定接口可用地址的信息(手册页中的const char *node)。

现在,正在检查每个结构并打印出有关该结构的信息。要打印出 IPv4IPv6,变量 ipver 会相应设置。在打印出信息之前,地址必须从二进制形式转换为字符串。这是由inet_ntop*n*umber to *p*ointer)完成的。

inet_ntop (ipstr) 和 ipver 的结果字符串现在打印到控制台。但是,打印ipver 并不是必需的,因为您可以从ipstr 中识别地址类型:IPv4 地址(众所周知)写成192.168.1.10,而IPv6 地址使用冒号分隔地址元素:@987654335 @。

【讨论】:

  • 我知道这会很简单,但这实际上是我第一次与网络编程面对面的战斗;)所以对于像我这样的小伙伴来说可能会有点困惑哈哈。
【解决方案3】:

是的,res 指向代表主机不同 IP 地址的addrinfo 结构的链接列表。 MSDN documentation on the getaddrinfo function 非常好。我不知道你在哪个平台上运行,但在其他平台上应该不会有太大不同。

【讨论】:

  • Unix 平台。我猜 *p 只是迭代器或通过链表的东西?
  • 是的,*p 在循环的顶部被设置为列表中的第一个元素(res),然后对于每次迭代,它被重置为 p->ai_next,它是一个指针到列表中的下一个元素。当 p->ai_next 为 NULL 时,您位于列表的末尾。
  • 好吧,那就更有意义了。
猜你喜欢
  • 2011-05-16
  • 2014-05-10
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2022-01-23
  • 1970-01-01
相关资源
最近更新 更多