【发布时间】:2017-04-15 05:02:35
【问题描述】:
我是 SparkR 的新手,边走边学,在 2.2.0 版 - SNAPSHOT 上。我有一个带有一列 UTC 时间戳、一列时区的 SparkDataFrame。例如:
mydates<- c("2012-12-22 14:23:05", "2015-01-19 16:37:42", "2017-03-02 08:22:55")
mytimeZones<- c("America/Chicago", "America/New_York", "Pacific/Galapagos")
dfr<- data.frame(date=mydates, timezone=mytimeZones)
dfs<- SparkR::createDataFrame(dfr)
我想做的是为我的数据集中的每个观察创建一列当地时间。我看到from_utc_timestamp() 函数接收一列时间戳和一个表示所需时区转换的字符串。我的问题是我有两个专栏。鉴于此,我想知道工作流程需要是什么,以及是否有更多 SparkR 经验的人愿意深入了解我如何解决这个问题?目前,我尝试过这样的事情:
dftest<- withColumn(dfs, "LocalTime",
SparkR:::foreach(dfs, function(x){from_utc_timestamp(y=x$date, x=x$timezone)})
)
但没有成功。我希望有人在 SparkR 中解决了这个问题并可以帮助我。谢谢你的时间。 亲切的问候, 内特
【问题讨论】:
标签: r apache-spark sparkr