【发布时间】:2014-09-24 06:21:26
【问题描述】:
我有一个包含 1000 万条记录的数据。我有一个 R 代码,需要使用 3000 次迭代来估计模型的系数。在这些数据上运行 R 代码非常耗时,有时我的系统会挂起。我正在使用具有 4 GB 内存的 Windows 8.1-64 位版本。 为了减少时间,我想将 R 与 Python 集成。虽然我对 R 有一定的了解,但我对 Python 完全陌生。我发现 rpy2 可以用来从 python 调用 R(我有 python 版本 3.4.1)。 我做了以下事情:
导入 rpy2
将 rpy2.robjects 导入为 robjects
但是是给出以下错误:
Traceback(最近一次调用最后一次): 文件“C:\Python34\lib\site-packages\rpy2\rinterface__init__.py”,第 29 行,在 0,win32con.KEY_QUERY_VALUE) pywintypes.error: (2, 'RegOpenKeyEx', '系统找不到指定的文件')
在处理上述异常的过程中,又发生了一个异常:
Traceback(最近一次调用最后一次): 文件“”,第 1 行,在 将 rpy2.robjects 导入为 robjects 文件“C:\Python34\lib\site-packages\rpy2\robjects__init__.py”,第 15 行,在 导入 rpy2.rinterface 作为 rinterface 文件“C:\Python34\lib\site-packages\rpy2\rinterface__init__.py”,第 32 行,在 除了 ImportError(ie): NameError: 名称 'ie' 未定义
我不明白为什么会出错。如何克服错误。
但是,如果我执行以下操作,它的工作原理:
从 rpy2 导入 *
如果有人详细解释如何从 Python 调用 R 并为我的问题提供解决方案,那将非常有帮助。 任何其他关于如何在 R 中以更短的时间运行大数据的解决方案也将受到赞赏。 提前致谢!
【问题讨论】:
-
python 将如何帮助优化这一点?
-
是否有其他方法可以在 R 中处理大数据?
标签: python r python-3.x bigdata