【发布时间】:2016-02-05 21:14:53
【问题描述】:
我正在尝试将我的 numpy 数据点数组拆分为测试集和训练集。为此,我从数组中随机选择行作为训练集,其余为测试集。
这是我的代码:
matrix = numpy.loadtxt("matrix_vals.data", delimiter=',', dtype=float)
matrix_rows, matrix_cols = matrix.shape
# training set
randvals = numpy.random.randint(matrix_rows, size=50)
train = matrix[randvals,:]
test = numpy.delete(matrix, randvals, 0)
print matrix.shape
print train.shape
print test.shape
但我得到的输出是:
matrix.shape: (130, 14)
train.shape: (50, 14)
test.shape: (89, 14)
这显然是错误的,因为训练和测试的行数应该加起来矩阵中的总行数但这里显然更多。谁能帮我弄清楚出了什么问题?
【问题讨论】:
标签: python arrays numpy matrix