在 C 中使用 sscanf 从标准输入流中解析数字答案

【问题标题】：Parsing numbers from standard input stream using sscanf in C在 C 中使用 sscanf 从标准输入流中解析数字
【发布时间】：2017-08-22 09:28:03
【问题描述】：

在 C 中使用 sscanf 从标准输入流中解析数字

我有一个文本文件，其中包含以字母开头的行，然后是无符号整数（有时是一对，有时只有一个）。在每行的乞求处都有一个字母来对行进行分类。（见下文）我能够获取文件的内容并将其读取到屏幕上。但是，我正在努力使用 sscanf 从每一行中提取字母和每个整数。所以结果将是 char、int 和 int 都在单独的变量中 - 仅使用“a”行作为示例。我一直在使用下面的代码。我得到的最好的结果是 sscanf 会导致出现全零的奇怪行为。同样，我试图将 char 和每个 int 放入单独的变量中。

文本文件中的行示例

a -1109180 699692587
a 1213834231 -226769626
c 994957275 2082945813
e 1213834231


//The Code Used//////////////

char *line = NULL;
size_t size;
int results;

int val1;
int val2; 

while (getline(&line, &size, stdin) != -1){

    if(strstr(line,"a") != NULL){

        sscanf(line,"Val1 and Val2: %d %d", val1,val2);
        printf("Value1 %d\n",val1);
        printf("Value2 %d\n",val2);

    }

//This prints each line in file 
printf("%s\n", line);

}

对这里缺少的东西有点不知所措。 sscanf 是在 C 中实现这一目标的最佳方法还是有更简单的替代方法？提前致谢。

【问题讨论】：

"Val1 and Val2: %d %d" 与输入不匹配。 sscanf(line,"Val1 and Val2: %d %d", val1,val2); --> sscanf(line, "a %d %d", &val1, &val2);
开启警告，通常是-Wall。他们会发现一堆错误。
检查sscanf() 的返回值。是2吗？
并且在不再需要时不要忘记free (line);（记住，它是由getline动态分配的）。是的，它在程序退出时被释放，但要养成跟踪和释放你分配的任何内存的习惯。
谢谢。你们好棒！做到了。但是，因为有些行有两个整数而其他行有一个，所以每次我做 sscanf(line,"%c%d",&category,&val1);在一行有一个整数，然后 print("GET VAL1: %d\n",val1);它甚至不会编译。我收到以下错误：架构 x86_64 的未定义符号：“_print”如果这与原始问题无关，我很抱歉，我将开始一个新问题。你帮了大忙。

标签： c parsing scanf

【解决方案1】：

Ethan，有时候你只需要放慢速度来帮助 C 就位。在您的情况下，您的数据显然将在每行的开始行中包含一个分类字符。后面可以跟着一两个数字，您需要相应地阅读和处理。您的问题由您的数据集定义。

谢天谢地，您可以使用面向行的输入函数fgets 或getline，然后对每个喜欢的人单独调用sscanf 来处理所有情况。阅读您的行后，您将其传递给类似于以下内容的sscanf 调用：

rtn = sscanf (buf, "%c %d %d", &c, &v1, &v2);  /* always check return */

保留返回（即根据您的格式字符串发生的成功转换次数），您可以开始回答有关您可以预期的数据的逻辑问题。但是，在盲目比较是否存在三个、两个或更少的转换之前，您可以通过查看缓冲区中的第一个字符来回答简单的问题。如果您需要一个小写字母来开始一个有效的行，那么您需要做的就是取消引用您的缓冲区以获取第一个字符，然后检查它是否在'a' - 'z' 之间。如果不是，则它不是有效的行。同样，如果您检查第一个字符并找到它0（终止字符）或'\n'，那么您知道该行是空的，您不必再为它烦恼。这两个测试将过滤掉所有的杂物，至少留下符合您标准的行。例如简单地检查：

    if (rtn == 0) { /* no successful conversions took place */
        fprintf (stderr, "error: no values parsed from line.\n");
        continue;
    }

    if (!*buf || *buf == '\n') {    /* check if buf was empty line */
        fprintf (stderr, "error: line is empty or contians only newline.\n");
        continue;
    }

    if (*buf < 'a' || 'z' < *buf) {  /* check first char not a-z */
        fprintf (stderr, "error: no lowercase char beginning line.\n");
        continue;
    }

让您确信至少您操作的生产线有合理的机会匹配您正在寻找的产品。

现在你可以做和if ... else if .... else if ....（这很好），或者因为你知道你主要关心检查值1-3，switch 语句对于处理剩余的行是有意义的。例如，您可以执行以下操作来解析那些值得一看的行中的值：

    switch (rtn) {  /* switch on number of successful conversions */

        case 3:     /* three successful conversions */
            printf ("all values: '%c'  %d  %d\n", c, v1, v2);
            break;

        case 2:     /* two successful conversions */
            printf ("two values: '%c'  %d\n", c, v1);
            break;

        default:    /* one or less (need at least two */
            fprintf (stderr, "error: no character and value on line.\n");
    }

将所有这些部分放在一起，您可以执行以下操作：

#include <stdio.h>

#define MAXC 256

int main (void) {

    char buf[MAXC] = "";

    while (fgets (buf, MAXC, stdin))    /* read each line into buf */
    {
        char c;
        int v1, v2, rtn;     /* vars for values and sscanf return */

        rtn = sscanf (buf, "%c %d %d", &c, &v1, &v2); 

        if (rtn == 0) { /* no successful conversions took place */
            fprintf (stderr, "error: no values parsed from line.\n");
            continue;
        }

        if (!*buf || *buf == '\n') {    /* check if buf was empty line */
            fprintf (stderr, "error: line is empty or contians only newline.\n");
            continue;
        }

        if (*buf < 'a' || 'z' < *buf) {  /* check first char not a-z */
            fprintf (stderr, "error: no lowercase char beginning line.\n");
            continue;
        }

        switch (rtn) {  /* switch on number of successful conversions */

            case 3:     /* three successful conversions */
                printf ("all values: '%c'  %d  %d\n", c, v1, v2);
                break;

            case 2:     /* two successful conversions */
                printf ("two values: '%c'  %d\n", c, v1);
                break;

            default:    /* one or less (need at least two */
                fprintf (stderr, "error: no character and value on line.\n");
        }
    }

    return 0;
}

输入文件示例

$ cat dat/input.txt
a -1109180 699692587
a 1213834231 -226769626
c 994957275 2082945813
e 1213834231

还有一个更混乱的文件：

$ cat dat/rows.txt
a -1109180 699692587
a quick brown fox jumps over the lazy dog
a 1213834231 -226769626

c 994957275 2082945813
227 isn't good
e 1213834231

应该提供一个很好的测试，看看代码是否能完成你需要它做的事情。通过代码运行数据提供：

使用/输出示例

$ /bin/sscanf_mixed <dat/input.txt
all values: 'a'  -1109180  699692587
all values: 'a'  1213834231  -226769626
all values: 'c'  994957275  2082945813
two values: 'e'  1213834231

更混乱的文件输出：

$ ./bin/sscanf_mixed <dat/rows.txt
all values: 'a'  -1109180  699692587
error: no character and value on line.
all values: 'a'  1213834231  -226769626
error: line is empty or contians only newline.
all values: 'c'  994957275  2082945813
error: no lowercase char beginning line.
two values: 'e'  1213834231

如您所见，两个输入文件提供了相同数量的转换，第二个输入文件只是简单地记录了遇到不合格行时发生的错误或问题。

检查一下，如果您有任何问题，请告诉我。有很多方法可以解决问题的逻辑，但是无论您选择哪种方式，您都希望确保构建所有输入例程足够灵活，以处理您应该合理期望的那些条件（空行等）在现实世界中使用。

【讨论】：

大卫，你是一位了不起的教练/向导。根据您的解释，我理解并能够实现一切。我真诚地感谢你。同样，我从未见过有人如此清晰地解释 C。谢谢！另外，请注意，我正在考虑您的所有建议/指示，并将根据我的近期学习目标对其进行修改。
很高兴能帮上忙。有时只需要一点帮助就可以开始使用 C。它确实是您可以学习的（如果不是）最灵活和最有效的语言之一。但它有很多。我得到的最好的建议是简单地“放慢速度”，“检查手册页”为每个使用的函数，“总是使用返回”来验证你使用的每个函数调用的结果。（并且始终在启用警告的情况下进行编译，例如在您的编译字符串中使用-Wall -Wextra，并且在编译没有警告之前绝不接受代码）