【发布时间】:2018-09-21 12:27:11
【问题描述】:
我有一个每月创建的 3000 万行 CSV,我正在尝试添加 2 个基于单独文件中的查找填充的字段,并让它在无人值守的情况下运行。我现在正在尝试选择这项技术——我宁愿使用可以从命令行(Windows)运行的脚本语言,理想情况下是免费的,但可以接受建议。 SQL 数据库并不是一个真正的选择。
【问题讨论】:
-
对于这么大的文件,你可以考虑支持多线程的东西。
-
这里有一个很好的工具列表可能适用:Structured Text Tools。一个数字将对 CSV 文件进行连接。从描述中不清楚是否针对 CSV 文件进行连接可以解决问题,但可能值得一看。
-
谢谢 - 我要试试 POSIX join 和 awk
标签: windows csv etl scripting-language