【发布时间】:2016-11-11 11:45:51
【问题描述】:
我在 Java 中使用 Apache Spark 1.6.2。
我有一个 DataFrame,其中包含:
- creation_date 字段中的日期,
- close_date 字段中的结束日期。
如果业务没有关闭,那么close_date的值为null。
我想:
- 向我的 DataFrame 添加一个名为 last_date_business 的额外列
- 用 close_date 的值填充它
- 如果 close_date 为空,则使用 current_date()
我可以请 Spark 做还是应该手动做?
【问题讨论】:
标签: java apache-spark dataframe apache-spark-sql