【发布时间】:2011-01-24 02:31:27
【问题描述】:
我有大量字符串用于自然语言处理研究,我想要一种将其存储在 Python 中的好方法。
我可以使用 pickle,但是将整个列表加载到内存中是不可能的(我相信),因为它大约 10 GB 大,而且我没有那么多的主内存。目前,我将列表与搁置库一起存储...搁架由字符串“0”、“1”、...、“n”索引,这有点笨拙。
有没有更好的方法将这样的对象存储在单个文件中,并且仍然可以随机(ish)访问它?
可能最好的选择是将其拆分为多个列表。
谢谢!
【问题讨论】:
标签: python list nlp pickle shelve