【发布时间】:2010-09-29 11:36:57
【问题描述】:
将文本文件读入动态一维数组的最有效方法是什么?在每次读取字符后重新分配似乎很愚蠢,在每次读取行后重新分配似乎并没有好多少。我想将整个文件读入数组。你会怎么做?
【问题讨论】:
-
我可能误解了你想要做什么:你想把整个文件读入一个大缓冲区,还是你想要一个每行都有一个条目的数组?
将文本文件读入动态一维数组的最有效方法是什么?在每次读取字符后重新分配似乎很愚蠢,在每次读取行后重新分配似乎并没有好多少。我想将整个文件读入数组。你会怎么做?
【问题讨论】:
我不太明白你想要什么。您是否要增量处理文件,从中读取一行,然后放弃并处理下一行?还是要将整个文件读入缓冲区?如果你想要后者,我认为这是合适的(在实际代码中检查 malloc 和 fopen 的 NULL 返回,以确定文件是否存在以及是否有足够的内存):
FILE *f = fopen("text.txt", "rb");
fseek(f, 0, SEEK_END);
long pos = ftell(f);
fseek(f, 0, SEEK_SET);
char *bytes = malloc(pos);
fread(bytes, pos, 1, f);
fclose(f);
hexdump(bytes); // do some stuff with it
free(bytes); // free allocated memory
【讨论】:
sizeof(char)被定义为1,所以没有区别。第二个问题:不,您可能应该逐步阅读它(例如,逐行或其他一些分段方法)。否则,你的记忆会很快耗尽。
如果您的系统上有mmap(2),您可以打开该文件并将其映射到内存中。这样,你就没有内存要分配,你甚至不必读取文件,系统会做。 您可以使用 litb 提供的 fseek() 技巧来获取大小。
void *mmap(void *start, size_t length, int prot, int flags, int fd, off_t offset);
EDIT:您必须使用 lseek() 来获取文件的大小,.
int fd = open("filename", O_RDONLY);
int nbytes = lseek(fd, 0, SEEK_END);
void *content = mmap(NULL, nbytes, PROT_READ | PROT_WRITE, MAP_PRIVATE, fd, 0);
【讨论】:
fstat(2) 函数:struct stat S; fstat(fd, &S);,然后 int nbytes = S.st_size 是文件大小(以字节为单位),直接来自文件系统,无需读取文件(这无疑会得到与上面相同的结果;我主要是为了完整性而提到它)。
如果您想使用 ISO C,请使用this function。
这是 litb 的答案,包含一些错误处理...
【讨论】: