【发布时间】:2019-04-01 11:52:12
【问题描述】:
我正在为算法创建测试和训练数据。我在不同的 csv 文件中有数据,我想从中创建训练和测试数据。
我已将所有 csv 文件导入到 pandas 数据框中,使用
dfs = [pd.read_csv(file) for file in datafiles]
dfs[1] 具有第一个数据帧 dfs[2] 第二个,依此类推
我想将它们分配给不同的数据框,格式为 Xtest1 为 dfs[1],Xtest2 为 dfs[2],依此类推,直到文件结束
任何人都可以使用循环或任何其他想法来帮助做到这一点
【问题讨论】:
-
你在使用 sklearn 吗?他们有一个功能可以为您执行此操作。
-
为什么要在全球环境中充斥着许多相似的对象,而不是继续使用你拥有的一个列表?
标签: python python-3.x pandas