【发布时间】:2019-08-28 19:43:02
【问题描述】:
我想将稀疏矩阵随机拆分为相同维度的训练和测试数据,同时确保训练集中没有全零的列或行。
为了使我的算法正常工作,我需要在训练集的每一行和每一列中至少有一个值。
我尝试过使用这个库函数: 从 sklearn.model_selection 导入 train_test_split
例如给定矩阵:
[[0, 1, 3, 1],
[0, 0, 0, 1],
[8, 0, 0, 1]]
矩阵可以被拆分以产生这个训练矩阵:
[[0, 1, 0, 1],
[0, 0, 0, 0],
[0, 0, 0, 8]]
其中第二行仅包含 0。我怎样才能避免这种情况?
【问题讨论】:
标签: python machine-learning cross-validation train-test-split