【发布时间】:2021-05-14 06:54:01
【问题描述】:
我已加载 CIFAR10 数据集,但我想将其分成多个部分。 这是我下载数据集的方式
(x_train, y_train), (x_test, y_test) = cifar10.load_data()
然后我使用 ShuffleSplit 创建了一个生成器来拆分数据,如下所示:
from sklearn.model_selection import ShuffleSplit
rs = ShuffleSplit(n_splits=3, test_size=0.1, random_state=0)
splits = rs.split(x_train)
我知道我可以使用以下方法迭代生成的拆分:
for train_index, test_index in splits:
#train_index is a np array which hold the indies
print("TRAIN:", train_index, "TEST:", test_index)
假设我想在最后。
x_train1, y_train1, x_train2, y_train2, x_train3, y_train3
如何根据生成的索引划分数据,以便一个训练拆分同时包含训练和测试索引?
我尝试将索引组合到列表中或联系数组,但没有成功。
【问题讨论】:
标签: python numpy scikit-learn