【发布时间】:2021-02-15 11:38:33
【问题描述】:
我是 R 新手,试图在 sparkR 中重写 R 代码。对名为 costTbl(有 5 个其他列)的 data.table 的操作之一是
costTbl[,cost:=na.locf(cost,na.rm=FALSE),by=product_id]
costTbl[,cost:=na.locf(cost,na.rm=FALSE, fromLast=TRUE),by=product_id]
我无法在 sparkR 中找到等效的操作。我认为可以通过在 product_id 上对 df 进行分组并执行此操作来使用 gapply。但我无法使代码工作。
gapply 是正确的方法吗?有没有其他方法可以实现这一点?
【问题讨论】:
标签: r apache-spark-sql sparkr locf