【发布时间】:2016-07-12 19:45:31
【问题描述】:
我的 Spark/Scala 代码中有一个 DataFrame 类型的变量 rawData。
我想删除第一个元素,如下所示:
rawData.drop(1)
但是,drop 功能不可用。
删除第一个元素的最简单方法是什么?
【问题讨论】:
-
你怎么知道第一个是什么? RDD 分布在节点之间。
-
因为我假设每个
Row都有一个id。就我而言,我从csv文件中读取数据,因此我假设该文件的第一行将成为Row,其中id最小。 -
不,不是。这个问题指的是
RDD,我有一个DataFrame。
标签: scala apache-spark dataframe