【发布时间】:2019-01-26 22:29:19
【问题描述】:
我有一个 rdd,我试图只过滤浮点类型。 Spark rdds 是否提供任何方法来执行此操作?
我有一个 csv,我只需要将大于 40 的浮点值放入新的 rdd。为此,我正在检查它是否是 float 类型的实例并过滤它们。当我使用! 过滤时,所有字符串仍然存在于输出中,当我不使用! 时,输出为空。
val airports1 = airports.filter(line => !line.split(",")(6).isInstanceOf[Float])
val airports2 = airports1.filter(line => line.split(",")(6).toFloat > 40)
在.toFloat,我遇到了NumberFormatException,我试图在try catch 块中处理它。
【问题讨论】:
标签: scala apache-spark rdd