【发布时间】:2019-05-24 04:12:42
【问题描述】:
我设法使用 np.concatenate 逐行连接两个大小相同(即列数相同)的 csv 数据集。
combined = np.concatenate((price1,price2))
如何使用 numpy 逐行连接两个不同大小的 csv 数据集(它们包含通用标题,但其中一个数据集有一个附加列)?
dataset1 的标题:a,b,c,d,e,f,g,h,i,k
dataset2 的标题:a,b,c,d,e,f,g,h,i,j(分析不需要的附加列),k
非常感谢。
【问题讨论】:
-
附加列会发生什么?缺少列的数据集的填充值?还是删除多余的列?
-
第 j 列对于我后续的分析/matplot 是多余的,因此可以将其删除 @ParitoshSingh
-
描述您已加载的数组 - shape、dtype 等。在 numpy 中,我们连接数组,而不是 csv 文件。
-
假设您使用的是
np.genfromtxt,您可以使用usecols参数来加载dataset2 而无需额外的列。 -
我想出了另一种方法。我创建了 dataset2 的一个子集:
dataset2_sub = dataset2[['a','b','c','d','e','f','g','h','i','k']]。然后将np.concatenate用于dataset1 和dataset2_sub,它们的列数与dataset1 相同。谢谢大家
标签: python numpy join merge concatenation