【发布时间】:2016-04-05 00:08:13
【问题描述】:
我有一个 1505MB 大小的文本文件,其中包含浮点数据。该文件有大约 73000 行和 1500 列。我想将文件的内容读入numpy 数组,然后对数组执行一些分析,但是我的机器使用numpy.readtxt 读取文件变得很慢。使用python将此文件读入数组的最快方法是什么?
【问题讨论】:
-
你说“越来越慢”。我们在这里说话有多慢?您使用了多少内存?
-
是稀疏矩阵吗?
-
@user2357112 我的机器上有四个 cpu,它们的性能都达到了 4% 到 100%,基本上我不能用我的机器做其他事情。
-
检查stackoverflow.com/questions/15096269/…(使用pandas.read_csv,空格作为分隔符)
-
@ChrisP 该文件包含大约 73000 个对象的概率分布。不知道有多稀少?!!
标签: python arrays numpy file-io text-files