【发布时间】:2018-07-06 23:03:27
【问题描述】:
我想在线性回归中使用日期。 所以我必须将其转换为数字。我必须设置最低日期 0 并根据日期差异不断增加一个数字。
然后我可以使用 Scala、Spark MLlib 在线性回归中使用日期字段。 我已经准备好包含日期在内的一些字段的数据框。 例如,
| date | id |
| 01-01-2017 | 12 |
| 01-02-2016 | 13 |
| 05-05-2016 | 22 |
对于一个字符串,我使用一种热编码技术来实现。但是对于日期,我如何将第一个日期设置为 0,然后根据差异增加数字? 谢谢。
【问题讨论】:
标签: scala apache-spark machine-learning linear-regression apache-spark-mllib