【发布时间】:2013-07-15 23:53:59
【问题描述】:
我有大约 350000 个单列 csv 文件,它们基本上是 200 - 2000 个数字,一个接一个地打印。数字格式如下:“-1.32%”(无引号)。我想合并文件以创建一个 csv 文件的怪物,其中每个文件都是一个单独的列。合并后的文件最多有 2000 行(每列可能有不同的长度)和 350000 列。
我想用 MySQL 来做,但有 30000 列的限制。 awk 或 sed 脚本可以完成这项工作,但我不太了解它们,我担心这需要很长时间。如果解决方案需要,我可以使用服务器。有什么建议吗?
【问题讨论】:
-
你如何匹配行?还是他们都只是从顶部开始?
-
cat file1 file2... > hugeFile呢? -
Powershell 可能很容易做到这一点
-
-它们都从顶部开始-cat 不会将列一个接一个地放置(它只是将它们附加到底部)
标签: sql csv unix large-data-volumes large-data