【发布时间】:2018-07-08 10:37:42
【问题描述】:
在 Apache Spark 2.0+ 中如何找到最小值的最大值,在以下问题中:
df1
+---+---+
| id| ts|
+---+---+
| 1| 20|
| 2| 15|
+---+---+
df2
+---+---+
| id| ts|
+---+---+
| 1| 10|
| 1| 25|
| 1| 36|
| 2| 25|
| 2| 35|
+---+---+
所需的数据框是:
+---+---+
| id| ts|
+---+---+
| 1| 10|
| 2| 15|
+---+---+
文字问题:对于df1 中的每个id,选择小于df1 中ts 值的最大ts 值,如果不存在这样的值,只需打印ts 值在df1。
【问题讨论】:
-
能否用您当前的尝试补充此代码请求,好吗?另外,请阅读How to make good reproducible Apache Spark Dataframe examples。
标签: apache-spark dataframe join apache-spark-sql spark-dataframe