【发布时间】:2017-09-04 01:24:35
【问题描述】:
我的大型 CSV 文件中有一些损坏的行,其中一些数据值由于缺少换行符而发生偏移。这会导致值出现在错误的列标题中。例如。如果我的表中存在三列,, , , 损坏后,我开始看到像 , , . 的值。
有没有办法让我删除所有行,例如我连续看到一个非整数,我知道实际上应该是一个 Int?
【问题讨论】:
-
您应该提供输入数据帧和预期的输出数据帧。
标签: scala apache-spark apache-spark-sql