【发布时间】:2022-08-23 15:25:28
【问题描述】:
我如何只能从 java spark 中的 csv 文件(文件中没有列名)中选择第 2 列和第 5 列,代码如下:
Dataset<Row> dataset = getSparkSession().get().read()
.option(\"delimiter\", \"|\")
.option(\"header\", false)
.csv(fileName);
-
如果你这样阅读文件,那么
_c1和_c4分别是第二和第五列。
标签: java apache-spark apache-spark-dataset