【发布时间】:2017-04-14 07:33:28
【问题描述】:
Weka 可以读取 csv 文件,但是,如果 csv 文件的格式不完全满足 Arff 文件标准,可能会导致一些问题。例如,我发现将时间序列 CSV 文件加载到 Weka 会导致反复出错。
网上有一些关于使用python将csv转换为arff的帖子,但是我觉得代码有点冗长,而且并不总是有效。
有没有更安全快捷的方法在 R 中将 csv 转换为 arff?
【问题讨论】:
Weka 可以读取 csv 文件,但是,如果 csv 文件的格式不完全满足 Arff 文件标准,可能会导致一些问题。例如,我发现将时间序列 CSV 文件加载到 Weka 会导致反复出错。
网上有一些关于使用python将csv转换为arff的帖子,但是我觉得代码有点冗长,而且并不总是有效。
有没有更安全快捷的方法在 R 中将 csv 转换为 arff?
【问题讨论】:
对于 Mac 用户(因为 RWeka for mac 尚未修复):
对于使用 CSVLoader 无法加载到 Weka 的 CSV 文件,使用 R 的外部库将数据集从 csv 文件转换为 arff 文件
下面的 R 代码可以将 timeSeries 数据集从 csv 转换为 Weka 接受的 arff 文件
library(dplyr)
library(lubridate)
library(foreign)
byd = read.csv('byd_ready.csv')
byd %>% glimpse()
byd = byd %>% mutate(tradeDate = as.Date(tradeDate))
write.arff(byd, file='byd_R1.arff')
【讨论】:
简单,使用RWeka包
library(RWeka)
write.arff(iris, file = "iris.arff")
【讨论】: