【发布时间】:2021-06-16 15:12:54
【问题描述】:
我正在尝试过滤掉我的 Spark DF,只在 numeric 字段中显示 text 值 - 因为数据是非结构化的。
不太清楚如何在上面的场景中使用下面的代码:
sparkdf = sparkdf.filter(col("colToFilter") <evaluation>)
如果我要在 SQL 中尝试类似的操作,我会执行以下操作:
SELECT * FROM tbl
WHERE col NOT LIKE '%[0-9]%'
我当前表格的示例如下所示:
|RefId|
|0|
|1|
|1|
|1|
|RefNum2|
|1|
我只想将“RefNum2”显示为输出。
非常感谢任何帮助。
谢谢。
【问题讨论】:
-
您能否将您的帖子与输入/输出数据的示例相结合?
标签: sql dataframe apache-spark pyspark apache-spark-sql