【发布时间】:2016-10-27 09:00:05
【问题描述】:
我正在尝试在 Apache Spark 上运行一个 5 GB 大小的 .arff 文件,并且我想编辑该文件中的一些数据。如何编辑 .arff 文件?
【问题讨论】:
标签: apache-spark arff
我正在尝试在 Apache Spark 上运行一个 5 GB 大小的 .arff 文件,并且我想编辑该文件中的一些数据。如何编辑 .arff 文件?
【问题讨论】:
标签: apache-spark arff
您可以尝试使用arff 包打开它:
import arff
X = []
y = []
for row in arff.load('cpu.arff'):
X.append(row[:-1])
y.append(row[-1])
here 是一个类似的问题。
【讨论】: