【问题标题】:Read text file, break each line into separate arrays and sort in C读取文本文件,将每一行分成单独的数组并在 C 中排序
【发布时间】:2016-08-06 16:38:25
【问题描述】:

我正在尝试编写一个程序来读取文本文件并将每一行分成单独的数组,以便可以按日期和名称对它们进行排序。我仍然无法让“按日期排序”功能正常工作/显示,这就是为什么我还没有尝试按名称排序功能。

我似乎能够很好地扫描日期和名称数组,但我认为我需要修改扫描最后一个数组“日期”的方式,因为我需要在逗号后用空格分隔它们。问题是我不确定如何将它们作为字符串扫描,因为它们之间会有空格,并且某些名称具有不同数量的状态。 (此时我删除了文本文件中状态之间的空格,但文本文件可能需要将它们放回原处?)

到目前为止我的代码...

#include <stdio.h>
#include <string.h>

#define MAX 30

void sortByDate( int year[], char *name[], char *states[], int count);
void sortByName(int year[], char name[], char states[], int count);

int main()
{
     int year[MAX]; 
     int i, a;
     int count = 0;
     int choice;
     char *name[MAX],
          *states[MAX];
     char b[MAX], c[MAX];

     FILE *inp = fopen("hurricanes.txt","r");               /* defining file input    */

     for(i=0;i<MAX;i++)
     {
         if( feof(inp) )
        {
            break;
        } 
        fscanf(inp, "%d", &a);
        fscanf(inp, "%s", &b);
        fscanf(inp, "%s", &c);
        year[i]=a;
        strcpy(&name[i],b);
        strcpy(&states[i],c);
        ++count; 

        printf("%d %s %s\n", year[i], &name[i], &states[i]);
     }

     printf("Press 0 to sort by date or 1 to sort by name: ");
     scanf("%d", &choice);  
     if (choice == 0)
     {
         sortByDate(year, name, states, count); 
     }
     else if ( choice == 1)
     {
          //sortByName(year, name, states, count); 
     }

     getch();
     return 0;
}

void sortByDate( int year[], char *name[], char *states[], int count )
{
     int d = 0;
     int c = 0;

     int yearTmp;
     char nameTmp[MAX], statesTmp[MAX];
     int order[count];
     int tmp = 0;

     FILE *outp = fopen("report.txt","w");                 /* defining file output   */

     for (c = 0; c < count; ++c)
     {
         order[c] = c; 
     } 

     for (c = 0 ; c < ( count - 1 ); c++)
     {
          for (d = 0 ; d < count - c - 1; d++)
          {
               if (year[d] > year[d+1])
               {
                    yearTmp = year[d];
                    year[d] = year[d+1]; 
                    year[d+1] = yearTmp; 

                    tmp = order[d];
                    order[d] = order[d+1];
                    order[d+1] = tmp;   
              }
          }
     }

     for (c = 0; c < count; ++c)
     {
          printf("%d %-10s %s\n",  year[c], &name[order[c]], &states[order[c]]); 
     } 
}

//void sortByName(int year[], char name[], char states[], int count)
//{
//} 

hurricanes.txt 文件....(我再次删除了状态之间的空格,但我认为需要将它们放回原处并进行不同的扫描?)

1960 Donna FL,NC
1969 Camille MS
1972 Agnes FL
1983 Alicia TX
1989 Hugo SC,NC
2005 Katrina FL,LA,MS
2005 Rita TX,LA
2005 Wilma FL
2008 Ike TX
2009 Ida MS
2011 Irene NC,NJ,MA,VT
2012 Isaac LA
1992 Andrew FL,LA
1995 Opal FL,AL
1999 Floyd NC
2003 Isabel NC,VA
2004 Charley FL,SC,NC
2004 Frances FL
2004 Ivan AL
2004 Jeanne FL

好的,所以我对此处发布的建议进行了一些更改,效果很好!

【问题讨论】:

  • 如果你想scanf()一个可以包含空格的字符串,你需要"%[]",而不是"%s"
  • 要读取包含空格的字符串,您可以使用"%N[^\n]",其中N 是向量的最大大小 - 1。这将读取到行尾或 N 个字符,无论先发生什么。
  • strcpy(&amp;name[i],b); --> name[i] = strdup(b);
  • 感谢 BLUEPIXY。你的建议也奏效了。

标签: c arrays sorting c-strings


【解决方案1】:

与其将值存储在单独的数组中,可能还有更好的方法。每当您面对由多个相关值组成的数据排序时,您应该考虑struct。这就是 C 中的机制,它提供了一种方法来关联由多个变量组成的数据的排序。

例如,在您的情况下,您有 (1) year、(2) 飓风 name 和 (3) 飓风 path,所有这些状态都代表一个事件。如果您的数据包含多个事件,并且您希望按yearnamepath 进行排序,则需要一种方法来保留哪个名称发生在哪一年和采用什么路径之间的相关性。像下面这样一个简单的结构就可以了

typedef struct {
    unsigned year;
    char name[MAXC];
    char path[MAXC];
} hcdata;

在您的程序中,您可以声明并数组类型hcdata 并用从您的文件中读取的数据填充数组。虽然您通常希望使用面向行的 输入函数(fgetsgetline)一次读取一行,但当您在每行上具有完全相同的信息格式时, scanf 系列函数可以提供一个现实的替代方案。 (它是限时之一scanffgets等的现实替代品。)

要使fscanf 的读取正常工作,您应该考虑正在读取的行中的每个字符(包括'\n')。虽然读取整数值会跳过中间的空格,但如果您养成记录每个字符的习惯,那么当您的下一行以字符开头时,您不会感到惊讶。在这种情况下,您可以使用格式字符串:

    char *fmt = "%u %31[^ ] %31[^\n]%*c";

最后,qsort 是在 C 库中对数据进行排序的默认标准方式。它使用几种不同的排序方法进行了优化,这些方法针对大/小数据集进行了优化,这些数据集协同工作以产生极快的排序。您需要做的就是编写比较函数以传递给qsort。使用上面的结构,要对nameyear 进行排序,compare 函数几乎是微不足道的。例如,

int cmpname (const void *a, const void *b)
{   return strcmp (((hcdata *)a)->name, ((hcdata *)b)->name); }

int cmpyear (const void *a, const void *b)
{   return ((hcdata *)a)->year - ((hcdata *)b)->year; }

您可以根据需要使用简单的排序功能,或者您可以定制排序以在主值之间没有差异的情况下对辅助参数进行排序。例如,如果year 相同,则按name 的字母顺序排序:

int cmpyear (const void *a, const void *b)
{   
    int diff = ((hcdata *)a)->year - ((hcdata *)b)->year;

    if (diff > 0)   /* if years differ, sort by year */
        return 1;
    else if (diff < 0)
        return -1;

    /* otherwise sort alphabetically with same year */
    return strcmp (((hcdata *)a)->name, ((hcdata *)b)->name);
}

然后排序变得像单个调用一样简单,例如:

    qsort (hcd, idx, sizeof *hcd, cmpname);

将所有部分放在一起,您可以读取数据,按name 排序,然后以简单的方式再次按year 排序:

#include <stdio.h>
#include <stdlib.h>
#include <string.h>

enum { MAXC = 32, MAXL = 128 };

typedef struct {
    unsigned year;
    char name[MAXC];
    char path[MAXC];
} hcdata;

int cmpname (const void *a, const void *b);
int cmpyear (const void *a, const void *b);
void prndata (hcdata *h, size_t n);

int main (int argc, char **argv) {

    hcdata hcd[MAXL] = {{ 0, {""}, {""} }};
    size_t idx = 0;
    char *fmt = "%u %31[^ ] %31[^\n]%*c";
    FILE *fp = argc > 1 ? fopen (argv[1], "r") : stdin;

    if (!fp) {  /* validate file open for reading */
        fprintf (stderr, "error: file open failed '%s'.\n", argv[1]);
        return 1;
    }

    /* read each line of data into an array of struct */
    while (idx < MAXL && fscanf (fp, fmt,
        &hcd[idx].year, hcd[idx].name, hcd[idx].path) == 3)
        idx++;

    printf ("\noriginal file order:\n\n");
    prndata (hcd, idx);

    qsort (hcd, idx, sizeof *hcd, cmpname);    /* sort by name */
    printf ("\nsorted by hurricane name:\n\n");
    prndata (hcd, idx);

    qsort (hcd, idx, sizeof *hcd, cmpyear);    /* sort by year */
    printf ("\nsorted by year:\n\n");
    prndata (hcd, idx);

    if (fp != stdin) fclose (fp);

    return 0;
}

int cmpname (const void *a, const void *b)
{   return strcmp (((hcdata *)a)->name, ((hcdata *)b)->name); }

int cmpyear (const void *a, const void *b)
{   return ((hcdata *)a)->year - ((hcdata *)b)->year; }

void prndata (hcdata *h, size_t n)
{
    if (!h || !n) return;
    size_t i;
    for (i = 0; i < n; i++)
        printf (" y: %u    n: %-10s    p: %s\n", h[i].year,
                h[i].name, h[i].path);
}

使用/输出示例

$ ./bin/hurricanes <dat/hurricanes.txt

original file order:

 y: 1960    n: Donna         p: FL,NC
 y: 1969    n: Camille       p: MS
 y: 1972    n: Agnes         p: FL
 y: 1983    n: Alicia        p: TX
 y: 1989    n: Hugo          p: SC,NC
 y: 2005    n: Katrina       p: FL,LA,MS
 y: 2005    n: Rita          p: TX,LA
 y: 2005    n: Wilma         p: FL
 y: 2008    n: Ike           p: TX
 y: 2009    n: Ida           p: MS
 y: 2011    n: Irene         p: NC,NJ,MA,VT
 y: 2012    n: Isaac         p: LA
 y: 1992    n: Andrew        p: FL,LA
 y: 1995    n: Opal          p: FL,AL
 y: 1999    n: Floyd         p: NC
 y: 2003    n: Isabel        p: NC,VA
 y: 2004    n: Charley       p: FL,SC,NC
 y: 2004    n: Frances       p: FL
 y: 2004    n: Ivan          p: AL
 y: 2004    n: Jeanne        p: FL

sorted by hurricane name:

 y: 1972    n: Agnes         p: FL
 y: 1983    n: Alicia        p: TX
 y: 1992    n: Andrew        p: FL,LA
 y: 1969    n: Camille       p: MS
 y: 2004    n: Charley       p: FL,SC,NC
 y: 1960    n: Donna         p: FL,NC
 y: 1999    n: Floyd         p: NC
 y: 2004    n: Frances       p: FL
 y: 1989    n: Hugo          p: SC,NC
 y: 2009    n: Ida           p: MS
 y: 2008    n: Ike           p: TX
 y: 2011    n: Irene         p: NC,NJ,MA,VT
 y: 2012    n: Isaac         p: LA
 y: 2003    n: Isabel        p: NC,VA
 y: 2004    n: Ivan          p: AL
 y: 2004    n: Jeanne        p: FL
 y: 2005    n: Katrina       p: FL,LA,MS
 y: 1995    n: Opal          p: FL,AL
 y: 2005    n: Rita          p: TX,LA
 y: 2005    n: Wilma         p: FL

sorted by year:

 y: 1960    n: Donna         p: FL,NC
 y: 1969    n: Camille       p: MS
 y: 1972    n: Agnes         p: FL
 y: 1983    n: Alicia        p: TX
 y: 1989    n: Hugo          p: SC,NC
 y: 1992    n: Andrew        p: FL,LA
 y: 1995    n: Opal          p: FL,AL
 y: 1999    n: Floyd         p: NC
 y: 2003    n: Isabel        p: NC,VA
 y: 2004    n: Charley       p: FL,SC,NC
 y: 2004    n: Frances       p: FL
 y: 2004    n: Ivan          p: AL
 y: 2004    n: Jeanne        p: FL
 y: 2005    n: Katrina       p: FL,LA,MS
 y: 2005    n: Rita          p: TX,LA
 y: 2005    n: Wilma         p: FL
 y: 2008    n: Ike           p: TX
 y: 2009    n: Ida           p: MS
 y: 2011    n: Irene         p: NC,NJ,MA,VT
 y: 2012    n: Isaac         p: LA

将此处的实现与您在单个数组中的存储方法以及您的排序例程进行比较。虽然上面的代码依赖于静态声明的结构数组,但如果您面临读取未知数字的情况,没有理由不能动态地根据需要动态声明结构。如果您还有其他问题,请告诉我。

【讨论】:

    【解决方案2】:

    如果你的 EOL 字符是 \n,你可以使用这个:

    fscanf(inp, "%d %s %29[^\n]", &a, b, c);
    

    其中 29 是 MAX - 1。将 \n 替换为您的 EOL 字符。

    请注意,您不需要将 &amp;b, &amp;c 传递给 fscanf,因为您的编译器会将 b 和 c 转换为 &amp;b[0]&amp;c[0]。 此外,在printf 上,您正在传递&amp;name[i],当您的编译器期待char * 时,这是char **。您需要将&amp;name[i] 更改为name[i]&amp;states[i] 也一样。

    【讨论】:

    • 其实char *name[MAX]之后,&amp;name[i]就是char**
    • 谢谢路易斯。效果很好!现在可以按日期排序了。
    • 如果这有帮助,您应该接受它作为您问题的答案。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2020-10-15
    • 1970-01-01
    • 1970-01-01
    • 2020-11-30
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多