【发布时间】:2012-06-09 03:11:52
【问题描述】:
我正在开发一个长时间运行的 Python 程序(其中一部分是 Flask API,另一个是实时数据获取器)。
我的两个长时间运行的进程都经常迭代(API 甚至可能每秒执行数百次)在大型数据集(对某些经济系列的逐秒观察,例如价值 1-5MB 的数据,甚至更多的)。它们还可以在序列等之间进行插值、比较和计算。
在迭代/作为参数传递/处理这些大型数据集时,我可以练习哪些技术,以保持我的进程处于活动状态?例如,我应该使用 gc 模块并手动收集吗?
更新
我最初是一名 C/C++ 开发人员,用 C++ 编写部件没有问题(甚至会喜欢)。我只是有 0 经验这样做。我该如何开始?
任何建议将不胜感激。 谢谢!
【问题讨论】:
-
用large-data和memory替换large和data标签
标签: python memory large-data