【发布时间】:2014-06-09 20:54:12
【问题描述】:
我有一个包含以下格式数据的文本文件;
100157 100157
100157 364207
100157 38848
100157 bradshaw97introduction
100157 bylund99coordinating
100157 dix01metaagent
100157 gray99finding
...
...
我正在尝试使用以下方法将其转换为 scikit 可读数据集:
datafile = open(filename.txt, 'r')
data=[]
for row in datafile:
data.append(row.strip().split('\t'))
c1 = open(filename.csv, 'w')
arr = str(data)
c.write(arr)
c.close
但是在执行此代码后,数据会在单行中输出,而我打算将数据以 csv 格式整齐地按行和列分隔,就像 Iris 数据集一样。
我可以就如何进行操作获得一些帮助吗?谢谢。
【问题讨论】:
-
请告诉我们结果应该是什么样子。
标签: python csv numpy split scikit-learn