【发布时间】:2015-08-02 09:57:05
【问题描述】:
我正在尝试使用 R 中 FSelector 包中的 chi.squared 函数进行特征选择。
我的数据集大约有 132 个变量 X 192,000 行。
chisquared.fs <- chi.squared(fo,df)
其中 fo 包含类变量:class ~.
运行代码时出现此错误:
Error in .jcall("weka/filters/Filter", "Lweka/core/Instances;", "useFilter",
:java.lang.OutOfMemoryError: Java heap space
我知道这是一个 Java 内存泄漏错误,并且在调用任何库之前我已经尝试过:
options( java.parameters = "-Xmx6g")
非常欢迎任何指针。
【问题讨论】:
-
tried this before calling any libraries您是否在加载库之前调用了options? -
是的,我就是这么做的。
-
6g 对于这么大的数据集可能不够。你盒子的最大内存是多少?您是否尝试将其设置为?还附加 jvisualvm 以确保内存确实分配给您的 java 进程
-
伙计们更新:我在没有重新启动 R 的情况下完成了 @copeg 建议的操作。我在调用库之前重新启动了 R 并在开头使用了选项语句,并且它起作用了。感谢您的建议。
标签: java r feature-selection