【发布时间】:2020-04-01 05:10:55
【问题描述】:
我有一个要加载到 Hive 的文件。它有 1 个标头记录和 2 个尾标记录。我正在跳过这 3 行。
文件上的 WC -l 提供 780112 条记录。780108 条记录正在加载到配置单元表中。
将此文件下载到excel有780113条记录,包括标题和尾部。 我假设文件中有一些空行或换行符,这可能是那 2 行丢失的行,为什么 WC -l 给出错误的计数。
如何找到它?
我尝试在 vi 编辑器中使用 :g 搜索空行,但没有给出匹配项。
【问题讨论】:
-
我发现问题在于跳过预告片无法正常工作。