【发布时间】:2016-02-05 12:10:09
【问题描述】:
我在加载一些数据的 Ubuntu 14.04 服务器上运行 python Flask 应用程序,主要的两件事是:
Google 新闻向量,用于 Word2vec(GoogleNewsVec 大约 4GB)
包含数据的 350MB json 文件
这一切都在大约 5 分钟内加载到我的本地 Windows 机器上,它的规格与服务器相似(8GB RAM)。奇怪的是,这两个部分分别加载正常。所以当我这样做时:
load_word2vec_model()
load_json_data()
它会很快加载模型并卡在 load_json_data():
[13:16:55] Loading model..
[13:17:13] Finished loading model.
[13:17:13] Loading scores..
[13:17:13] Loading scores dict from json file..
但是当我以相反的顺序进行时:
load_json_data()
load_word2vec_model()
在加载 word2vec 模型时卡住了:
[13:20:29] Loading scores..
[13:20:29] Loading scores dict from json file..
[13:22:42] Finished loading from json file.
[13:22:42] Finished loading scores.
[13:22:42] Loading model..
我没有收到任何 python 错误消息。这使我相信服务器以某种方式达到了最大值。内存使用,并且不会加载整个模型。
在我的本地 Windows 机器上,它确实会占用大量内存,但最终它会加载(总共大约 5 分钟)。为什么服务器上没有出现这种情况,我已经等了一个小时,但始终加载不出来。
这是服务器的 htop 输出:
【问题讨论】:
-
此问题缺少任何回溯或 Python 错误消息。
-
我没有收到任何错误消息。它就像它仍在加载,但它需要永远......
标签: python ubuntu memory-management