【问题标题】:Is it viable to use Hadoop with MongoDB as Database rather than HDFS使用 Hadoop 和 MongoDB 作为数据库而不是 HDFS 是否可行
【发布时间】:2013-09-07 06:02:24
【问题描述】:

我正在Hadoop with MongoDB as Database 而非 HDFS 中进行研究。所以,我需要一些关于性能和可用性的指导。

我的场景

我的数据是

  • 来自推特的推文
  • Facebook 新闻提要

我可以从 twitter 和 Facebook API 获取数据。为了进行 hadoop 处理,我需要存储。

所以我的问题是,将 Hadoop 与 Mongo DB 一起使用来存储社交网络数据(如 Twitter 提要、Facebook 帖子等)是否可行(或有益)?还是最好使用 HDFS 并将数据存储在文件中。任何专业知识指导将不胜感激。谢谢

【问题讨论】:

    标签: mongodb hadoop hdfs


    【解决方案1】:

    这样做是完全可行的。但这主要取决于您的需求。基本上,有了数据后你想做什么?

    也就是说,MongoDB 绝对是一个不错的选择。它擅长存储非结构化、深度嵌套的文档,例如您的 JSON。您不必太担心数据中的嵌套和关系。您也不必担心架构。无模式存储无疑是使用 MongoDB 的一个令人信服的理由。

    另一方面,我发现 HDFS 更适合平面文件,您只需选择标准化数据并开始处理。

    但这些只是我的想法。其他人可能有不同的看法。我的最终建议是很好地分析您的用例,然后确定您的商店。

    HTH

    【讨论】:

    • 如果有很大的文档并想从该文档中搜索。它在 HDFS 中逐行执行。这需要太多时间。 BIG 文件中是否有快速搜索的选项?
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2014-08-01
    • 1970-01-01
    • 1970-01-01
    • 2011-08-19
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多