【问题标题】:how to process large amount of images on hadoop如何在hadoop上处理大量图像
【发布时间】:2012-06-23 04:42:59
【问题描述】:

我想在 HDFS 上处理大量小图像。 Hadoop 提供归档 API 和顺序文件格式来存储大量小文件,以节省名称节点上的内存。但是,我需要在 map-reduce 之后检索符合我要求的图像。我不确定,但我认为从存档和顺序文件格式中检索图像可能很困难。但是如果我们不使用这些方法,我们可以选择返回文件的路径,让服务器通过这些路径从 HDFS 下载这些图像,尽管这可能会给 namenode 带来更大的压力。我无法决定使用哪种方案。任何人都可以提出任何建议吗?我真的很好奇谷歌如何将他们的图像存储在其数据中心并返回这些图像以响应用户的查询。

【问题讨论】:

    标签: hadoop hdfs


    【解决方案1】:

    你应该看看 HBase,它一方面允许你存储小文件和随机读/写,另一方面完全参与 map/reduce 作业

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2013-01-31
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多