【发布时间】:2016-01-20 10:13:50
【问题描述】:
是否可以在 hadoop 中进行实时交互式查询?
当我在 YARN/tez 上使用 Hive 时,延迟仍然太高,即使在 parquet/ocr 上也是如此。
有什么建议吗?
提前致谢
【问题讨论】:
是否可以在 hadoop 中进行实时交互式查询?
当我在 YARN/tez 上使用 Hive 时,延迟仍然太高,即使在 parquet/ocr 上也是如此。
有什么建议吗?
提前致谢
【问题讨论】:
Hadoop 不是实时或近实时查询的好选择。在 Hadoop 中运行任何东西的延迟开销都会很高。考虑使用 Apache Spark(因为我希望您有一个批处理系统,就像您使用 Hadoop 一样)。 Spark 使用 spark shell 提供交互式查询。您还可以使用 Impala 对存储在 HDFS 中的数据进行查询。我相信,与 Hive 相比,Impala 提供了更快的查询。
【讨论】: