【发布时间】:2017-06-05 13:34:37
【问题描述】:
我有一个包含一些列的数据框,在进行分析之前,我想了解这样的数据框有多完整,所以我想过滤数据框并为每列计算非空值的数量,可能会返回一个数据帧。
基本上,我试图达到与this question 中表达的相同的结果,但使用 Scala 而不是 Python...
假设你有:
val row = Row("x", "y", "z")
val df = sc.parallelize(Seq(row(0, 4, 3), row(None, 3, 4), row(None, None, 5))).toDF()
你如何总结每列的非空数并返回一个具有相同列数且只有一行的数据框的答案?
【问题讨论】:
-
非常感谢,如果您能分享一些 sn-ps 以更好地理解您提出的逻辑,我将不胜感激:我可以编写一个 UDF 来执行此操作,但我不知道该怎么做编写一段代码,为每一列执行 UDF