std::cin 在文本模式下打开,因此它会不断地寻找各种需要注意的东西(如换行符等)。
鉴于std::cin 输入流对字符的持续嗅探,我并不感到惊讶它需要更长的时间,但它似乎有点过分。以下,绕过iostream 并直接使用FILE 流可能会达到您的预期:
#include <cstdlib>
#include <cstdio>
int main(int argc, char *argv[])
{
static unsigned char const codebook[] =
{
0x00, 0x1E, 0x2D, 0x33, 0x4B, 0x55, 0x66, 0x78,
0x87, 0x99, 0xAA, 0xB4, 0xCC, 0xD2, 0xE1, 0xFF
};
for (int c = std::fgetc(stdin); c!=EOF; c=std::fgetc(stdin))
{
std::fputc(codebook[c >> 4], stdout);
std::fputc(codebook[c & 0x0F], stdout);
}
return EXIT_SUCCESS;
}
我在一个 10MB 的随机文件上测试了上面的 exact 代码,该文件加载了从a 到z 的字符,当使用std::cin 和std::cout 时,结果非常长。直接使用FILE 流,差异是巨大的。此答案中的所有代码均已使用Apple LLVM version 5.1 (clang-503.0.38) (based on LLVM 3.4svn) 使用-O3 优化进行了测试。
使用FILE 流
time ./hamming < bigfile.txt > bigfile.ham
real 0m1.855s
user 0m1.812s
sys 0m0.041s
使用std::cin 和std::cout
time ./hamming < bigfile.txt > bigfile.ham
real 0m23.819s
user 0m7.416s
sys 0m16.377s
将std::cin 和std::cout 与std::cout.sync_with_stdio(false); 一起使用
time ./hamming < bigfile.txt > bigfile.ham
real 0m24.867s
user 0m7.705s
sys 0m17.118s
总之,哎哟。值得注意的是在系统中花费的时间。如果我有机会使用std::istream::get() 和put() 方法来更新它,我会的,但老实说,我不希望有任何奇迹发生。除非有一些魔法(对我来说,而不是对其他人)从std::cin 关闭 io xlat 的方法,否则FILE 流可能是一个合理的选择。我还没有调查啜饮std::cin 的rdbuf() 是否是一个可行的选择,但它可能也有希望。
编辑:使用std::istreambuf_iterator<char>
使用 streambuf 迭代器类有显着改进,因为它基本上绕过了所有内联 slat 垃圾,但它仍然不如 FILE 流高效:
#include <iostream>
#include <cstdlib>
#include <cstdio>
int main(int argc, char *argv[])
{
static unsigned char const codebook[] =
{
0x00, 0x1E, 0x2D, 0x33, 0x4B, 0x55, 0x66, 0x78,
0x87, 0x99, 0xAA, 0xB4, 0xCC, 0xD2, 0xE1, 0xFF
};
std::istreambuf_iterator<char> cin_it(std::cin), cin_eof;
std::for_each(cin_it, cin_eof, [](char c)
{
std::cout.put(static_cast<char>(codebook[static_cast<unsigned char>(c) >> 4]));
std::cout.put(static_cast<char>(codebook[static_cast<unsigned char>(c) & 0x0F]));
});
return EXIT_SUCCESS;
}
结果:
time ./hamming < bigfile.txt > bigfile.ham
real 0m6.062s
user 0m5.795s
sys 0m0.053s
请注意,system 现在与FILE 流结果相当,但是user 中其余 iostream 模板的开销似乎是一个痛点(但仍然比其他 iostream 尝试更好)。你赢了一些,你失去了一些=P
编辑:无缓冲系统 IO
为了做到完全公平,绕过所有运行时缓冲并仅依靠系统调用来完成这种疯狂的行为,以下内容也值得注意:
#include <cstdlib>
#include <cstdio>
#include <unistd.h>
int main(int argc, char *argv[])
{
static unsigned char const codebook[] =
{
0x00, 0x1E, 0x2D, 0x33, 0x4B, 0x55, 0x66, 0x78,
0x87, 0x99, 0xAA, 0xB4, 0xCC, 0xD2, 0xE1, 0xFF
};
unsigned char c;
while (read(STDIN_FILENO, &c, 1)> 0)
{
unsigned char duo[2] =
{
codebook[ c >> 4 ],
codebook[ c & 0x0F ]
};
write(STDOUT_FILENO, duo, sizeof(duo));
}
return EXIT_SUCCESS;
}
如你所料,结果很糟糕:
time ./hamming < bigfile.txt > bigfile.ham
real 0m26.509s
user 0m2.370s
sys 0m24.087s