【问题标题】:Hadoop: Running beyond virtual memory limits, showing huge numbersHadoop:超出虚拟内存限制,显示巨大的数字
【发布时间】:2015-06-17 01:44:31
【问题描述】:

我正在运行一个 MapReduce Pipes 程序,并将内存限制设置如下:

在yarn-site.xml:

<property>
            <name>yarn.nodemanager.resource.memory-mb</name>
            <value>3072</value>
</property>
<property>
            <name>yarn.scheduler.minimum-allocation-mb</name>
            <value>256</value>
</property>

在mapred-site.xml中:

<property>
            <name>mapreduce.map.memory.mb</name>
            <value>512</value>
</property>
<property>
            <name>mapreduce.reduce.memory.mb</name>
            <value>512</value>
</property>
<property>
            <name>mapreduce.map.java.opts</name>
            <value>-Xmx384m</value>
</property>
<property>
            <name>mapreduce.reduce.java.opts</name>
            <value>-Xmx384m</value>
</property>

我目前在单个节点上以伪分布式模式运行。在容器被杀死之前,我收到以下错误:

2015-04-11 12:47:49,594 INFO [AsyncDispatcher event handler] org.apache.hadoop.mapreduce.v2.app.job.impl.TaskAttemptImpl: Diagnostics report from attempt_1428741438743_0001_m_000000_0: Container [pid=8140,containerID=container_1428741438743_0001_01_000002] is running beyond virtual memory limits. Current usage: 304.1 MB of 1 GB physical memory used; 1.0 TB of 2.1 GB virtual memory used. Killing container.

我最关心的是使用了 1.0 TB 的虚拟内存,我正在运行的应用程序远未消耗这么多内存,甚至远未消耗 1 GB 内存。

这是否意味着我的代码中存在内存泄漏,或者我的内存配置可能是错误的?

谢谢。

问候,

【问题讨论】:

  • 您的服务器可能交换了很多,也许您应该先调查一下。

标签: hadoop memory memory-leaks virtual-memory


【解决方案1】:

我发现了问题所在:在我的部分代码中,每个映射器都必须访问本地 lmdb 数据库。当一个 lmdb 数据库启动时,它会保留 1 TB 的虚拟内存,这导致 Hadoop 认为我使用了这么多内存,而实际上我并没有。

我通过在纱线中将 yarn.nodemanager.vmem-check-enabled 设置为 false 解决了这个问题-site.xml,防止 Hadoop 检查虚拟内存限制。请注意,除非您确定,否则不应使用它,因为 Hadoop 试图通过此检查保护您免受内存泄漏和类似问题的影响。我只使用它是因为我确定它不是内存泄漏

【讨论】:

猜你喜欢
  • 1970-01-01
  • 2017-09-12
  • 2012-12-16
  • 1970-01-01
  • 2018-10-13
  • 1970-01-01
  • 1970-01-01
  • 2012-05-14
  • 2016-11-23
相关资源
最近更新 更多