【发布时间】:2017-06-20 20:40:16
【问题描述】:
我真的是数据科学的新手……实际上是在做一门课程。
我正在尝试使用 spark sql 创建查询...您能帮我解决错误吗?非常感谢你 f.e.我不知道如何连接字符串并减去日期。 这是我试图使其工作的查询:
sqlDF5 = sqlContext.sql(sqlQuery=
"select document_number, count((distinct document_number) ||'-'|| rloc) as frecuency,
sum(revenue_amount_seg) as money,
datediff(day, max(departure_date_leg) as datetime,'2014-01-01 00:00:00' as datetime) as recency,
from clientes_unicos group by document_number")
【问题讨论】:
标签: apache-spark apache-spark-sql spark-dataframe pyspark-sql