【发布时间】:2018-11-13 12:47:02
【问题描述】:
我正在尝试根据以下条件向我的 Spark DataFrame 添加一个带有序列号的列:我想为其中一列中的每个组分配顺序整数。
我尝试了很多方法,但似乎没有任何效果。
df<-data.frame(location=c("a","a","d","d","d"),
device_id=c(123,3455,234,4565,675),
expected_column=c(1,2,1,2,3))
#final_data_visitor is my spark Data Frame
random_data<-final_data_visitor
random_data<-random_data %>%
group_by(location_id,device_subscriber_id)%>%
mutate(visit_seq=1:n())
random_data
# error is "Error in from:to : NA/NaN argument
In addition: Warning message:
In 1:n() : NAs introduced by coercion"
这是我尝试执行代码时遇到的错误:
"from:to 中的错误:NA/NaN 参数 另外:警告信息: 在 1:n() 中:强制引入的 NAs
【问题讨论】:
标签: r apache-spark dplyr apache-spark-sql sparklyr