【问题标题】:Is Apache Hama suitable for building a decision tree?Apache Hama 是否适合构建决策树?
【发布时间】:2012-10-01 06:03:18
【问题描述】:

我目前已在 Hadoop 中实现,这是 Google 用于构建决策树的框架(也称为 PLANET)。它从一个顶点开始,随着 map reduce 作业的添加越来越多,直到树完全构建。一个主要的问题是大量的 map/reduce 作业一个接一个地运行,因此一直启动新作业的成本非常高。

我多次看到 Apache Hama 适用于图等迭代算法。有人可以用 Hama 构建一个新图,或者您只需输入一个图并对其进行一些计算吗?将我的项目转移到哈马会很容易吗?谢谢

【问题讨论】:

  • 您好,我来自 Hama 团队,我会帮助您构建类似的东西,因为它可能非常适合我们的机器学习模块。您介意访问 hama-dev 邮件列表并再次提出您的问题吗? (hama.apache.org/mail-lists.html)。我认为图形模块不太适合。
  • 但是为了让你不那么兴奋,是的,Hama 可以非常有效地做到这一点。我的路线图上有这个,但我无法深入了解它。
  • 我看过你的帖子很多次了,Thomas,事实上我从你那里学到了哈马:P。我按照你说的发送到列表中

标签: java hadoop decision-tree hama


【解决方案1】:

Hama 确实能够使用 PLANET 论文中描述的算法以比 MapReduce 更有效的方式构建决策树。

Hama 不需要图形作为输入,您可以查看 Hama ML(机器学习)模块,该模块通常处理原始特征向量作为直接来自 HDFS 的输入。

对于 Hama,我创建了一个 new issue in the Apache Jira 来跟踪该算法的进度。

【讨论】:

  • 请不要添加“谢谢”作为答案。相反,请为您认为有帮助的答案投票。
  • @JBCP 你是警察吗?我不能投票给我自己的答案,你应该更新你的机器人:p
  • 这并没有提供问题的答案。要批评或要求作者澄清,请在其帖子下方发表评论。
  • @showdev 当然这回答了这个问题,我们为此添加了一张票并用它解决了他的问题。如果你仔细看,我已经对这个问题发表了评论。鉴于这是 2 岁,我不知道为什么现在会出现这种情况。
  • 在我看来,未解决的支持票不构成答案。作为评论会更好。
猜你喜欢
  • 1970-01-01
  • 2018-12-01
  • 2016-07-27
  • 2019-07-01
  • 2021-04-22
  • 2017-04-11
  • 2012-10-20
  • 2021-12-22
  • 2019-10-20
相关资源
最近更新 更多