【发布时间】:2020-04-30 05:04:26
【问题描述】:
我有一些序列存储在二维数组[[first_seq,first_seq],[first_seq,first_seq],[sec_seq,sec_seq]],.. 中。
每个向量序列的长度各不相同。有些是 55 行长,有些是 68 行长。
序列二维数组(features)的形状为(427,227)(,特征),我还有另一个一维数组(num_seq)(5,),其中包含每个序列的长度[55,68,200,42,62](例如第一个seq 是 55 行长, sencond seq 是 68 行长等)。 len(1D-array) = number of seq
现在,我需要每个序列都等长 - 即每个序列为 200。由于在此示例中我有 5 个序列,因此结果数组应为 structured_seq = np.zeros(5,200,227)
如果序列小于 200,则该序列的所有其他值都应为零。
因此,我尝试填写structured_seq 执行以下操作:
for counter, sent in enumerate(num_seq):
for j, feat in enumerate(features):
if num_sent[counter] < 200:
structured_seq[counter,feat,]
但我卡住了..
所以准确地说:第一个序列是二维数组的前 55 行(features),所有重复的 145 都应该用零填充。等等……
【问题讨论】:
标签: python pandas numpy padding