Ethan,有时候你只需要放慢速度来帮助 C 就位。在您的情况下,您的数据显然将在每行的开始行中包含一个分类字符。后面可以跟着一两个数字,您需要相应地阅读和处理。您的问题由您的数据集定义。
谢天谢地,您可以使用面向行的输入函数fgets 或getline,然后对每个喜欢的人单独调用sscanf 来处理所有情况。阅读您的行后,您将其传递给类似于以下内容的sscanf 调用:
rtn = sscanf (buf, "%c %d %d", &c, &v1, &v2); /* always check return */
保留返回(即根据您的格式字符串发生的成功转换次数),您可以开始回答有关您可以预期的数据的逻辑问题。但是,在盲目比较是否存在三个、两个或更少的转换之前,您可以通过查看缓冲区中的第一个字符来回答简单的问题。如果您需要一个小写字母来开始一个有效的行,那么您需要做的就是取消引用您的缓冲区以获取第一个字符,然后检查它是否在'a' - 'z' 之间。如果不是,则它不是有效的行。同样,如果您检查第一个字符并找到它0(终止字符)或'\n',那么您知道该行是空的,您不必再为它烦恼。这两个测试将过滤掉所有的杂物,至少留下符合您标准的行。例如简单地检查:
if (rtn == 0) { /* no successful conversions took place */
fprintf (stderr, "error: no values parsed from line.\n");
continue;
}
if (!*buf || *buf == '\n') { /* check if buf was empty line */
fprintf (stderr, "error: line is empty or contians only newline.\n");
continue;
}
if (*buf < 'a' || 'z' < *buf) { /* check first char not a-z */
fprintf (stderr, "error: no lowercase char beginning line.\n");
continue;
}
让您确信至少您操作的生产线有合理的机会匹配您正在寻找的产品。
现在你可以做和if ... else if .... else if ....(这很好),或者因为你知道你主要关心检查值1-3,switch 语句对于处理剩余的行是有意义的。例如,您可以执行以下操作来解析那些值得一看的行中的值:
switch (rtn) { /* switch on number of successful conversions */
case 3: /* three successful conversions */
printf ("all values: '%c' %d %d\n", c, v1, v2);
break;
case 2: /* two successful conversions */
printf ("two values: '%c' %d\n", c, v1);
break;
default: /* one or less (need at least two */
fprintf (stderr, "error: no character and value on line.\n");
}
将所有这些部分放在一起,您可以执行以下操作:
#include <stdio.h>
#define MAXC 256
int main (void) {
char buf[MAXC] = "";
while (fgets (buf, MAXC, stdin)) /* read each line into buf */
{
char c;
int v1, v2, rtn; /* vars for values and sscanf return */
rtn = sscanf (buf, "%c %d %d", &c, &v1, &v2);
if (rtn == 0) { /* no successful conversions took place */
fprintf (stderr, "error: no values parsed from line.\n");
continue;
}
if (!*buf || *buf == '\n') { /* check if buf was empty line */
fprintf (stderr, "error: line is empty or contians only newline.\n");
continue;
}
if (*buf < 'a' || 'z' < *buf) { /* check first char not a-z */
fprintf (stderr, "error: no lowercase char beginning line.\n");
continue;
}
switch (rtn) { /* switch on number of successful conversions */
case 3: /* three successful conversions */
printf ("all values: '%c' %d %d\n", c, v1, v2);
break;
case 2: /* two successful conversions */
printf ("two values: '%c' %d\n", c, v1);
break;
default: /* one or less (need at least two */
fprintf (stderr, "error: no character and value on line.\n");
}
}
return 0;
}
输入文件示例
$ cat dat/input.txt
a -1109180 699692587
a 1213834231 -226769626
c 994957275 2082945813
e 1213834231
还有一个更混乱的文件:
$ cat dat/rows.txt
a -1109180 699692587
a quick brown fox jumps over the lazy dog
a 1213834231 -226769626
c 994957275 2082945813
227 isn't good
e 1213834231
应该提供一个很好的测试,看看代码是否能完成你需要它做的事情。通过代码运行数据提供:
使用/输出示例
$ /bin/sscanf_mixed <dat/input.txt
all values: 'a' -1109180 699692587
all values: 'a' 1213834231 -226769626
all values: 'c' 994957275 2082945813
two values: 'e' 1213834231
更混乱的文件输出:
$ ./bin/sscanf_mixed <dat/rows.txt
all values: 'a' -1109180 699692587
error: no character and value on line.
all values: 'a' 1213834231 -226769626
error: line is empty or contians only newline.
all values: 'c' 994957275 2082945813
error: no lowercase char beginning line.
two values: 'e' 1213834231
如您所见,两个输入文件提供了相同数量的转换,第二个输入文件只是简单地记录了遇到不合格行时发生的错误或问题。
检查一下,如果您有任何问题,请告诉我。有很多方法可以解决问题的逻辑,但是无论您选择哪种方式,您都希望确保构建所有输入例程足够灵活,以处理您应该合理期望的那些条件(空行等)在现实世界中使用。