【发布时间】:2016-02-18 02:40:35
【问题描述】:
以下在 Spark SQL 中起作用:
val df = sqlc.sql(
"select coalesce(optPrefix.optSysIp,'--') as ip, count(1) as cnt
from llines group by coalesce(optPrefix.optSysIp,'--')"
).collect
res39: Array[org.apache.spark.sql.Row] = Array([192.168.1.7,57],[--,43]))
我们如何直接从数据帧应用合并?
scala> df.groupBy("coalesce(optPrefix.optSysIp,'--')").count.collect
org.apache.spark.sql.AnalysisException: Cannot resolve column name
"coalesce(optPrefix.optSysIp,'--')
我查看了数据框上有哪些方法。我无法辨别运行此合并操作的任何方法。想法?
【问题讨论】:
标签: sql scala apache-spark dataframe apache-spark-sql