【发布时间】:2016-09-05 20:51:01
【问题描述】:
我从一个表中提取了一个 1.5TB 的数据库。它被分成 7 个文件并用 RAR 压缩。
我想将字段的子集提取到另一个文件中进行处理。
我找到的示例处理 bzip 或 gzip 文件。我要问的可能吗?如果不是直接如何将文件转换为适用于 awk 的格式?
我在 Centos6 上有 ~146GB 的工作空间。
【问题讨论】:
-
这是一种专有格式,首先您需要一个可在您的操作系统上运行的提取软件。
awk适用于文本文件。