【发布时间】:2018-04-09 08:56:40
【问题描述】:
我有一个大型字符串数组,我将其存储为一个名为 np_base 的 nparray:np.shape(np_base)
Out[32]: (65000000, 1)
我打算做的是对数组进行垂直切片,以便将其分解为多个列,稍后我将以独立的方式存储这些列,因此我尝试遍历行索引并追加:
for i in range(65000000):
INCDN.append(np.base[i, 0][0:5])
但这会导致内存错误。
有人可以帮我解决这个问题吗,我一直在寻找一种对字符串数组进行切片的替代方法。
谢谢,
【问题讨论】:
-
几个问题。您只是想提取每个字符串的前 5 个字符吗?就地操作会起作用吗?您可以丢弃其余的字符串吗?是否有重复的字符串以便您可以分解?
-
嗨,基本上我的数组的每一行都存储为一个数组,而我想对整个数组进行切片以获得由作为索引的第 5 个字符组成的列,然后由以下 5 个其他字符组成的列,这是第一个特征,然后是其他 5 个字符,依此类推.. 我猜分解是最好的解决方案
标签: python arrays string slice