【问题标题】:How to install cloudera impala on EMR?如何在 EMR 上安装 cloudera impala?
【发布时间】:2013-06-18 09:13:17
【问题描述】:

有没有我可以安装唯一没有 cloudera 管理器和没有 cdh 的 impala。我将使用 apache 版本的 hadoop?

【问题讨论】:

    标签: hadoop hive cloudera amazon-emr impala


    【解决方案1】:

    是的,这是绝对可能的。将存储库添加到您的 sources.list 文件中,然后更新存储库。

    deb [arch=amd64] http://archive.cloudera.com/impala/ubuntu/precise/amd64/impala 精确-impala1 贡献 deb-src http://archive.cloudera.com/impala/ubuntu/precise/amd64/impala 精确-impala1 贡献

    在那之后,它只是:

    sudo apt-get install impala                (Binaries for daemons)
    sudo apt-get install impala-server         (Service start/stop script)
    sudo apt-get install impala-state-store    (Service start/stop script)
    

    但不要忘记满足所有先决条件。详细信息可以去here

    【讨论】:

    • 我尝试在 32 位 ubuntu 上两次在 EMR 上安装 impala。我才知道他们不支持它。之后我也在 64 位 ubuntu 上做了。然后它也没有工作。现在我怀疑cloudera是否支持与apache hadoop的集成。你愿意对此发表评论吗?所以这就是为什么我将其作为正确答案删除
    • 我自己在我的机器上安装了它(Ubuntu 64 位)。不过,您可能不得不为配置而苦苦挣扎。但是安装非常简单。
    • 我同意你必须安装在 64 位机器上。但是,您使用的是 cdh 还是 apache hadoop?我正在使用 apache hadoop。另外,如果我想在没有 cloudera manager 的 32 位 ubuntu 本地机器上安装它,它会工作吗?
    • Apache Hadoop-1.0.4。我不知道32位机器。我在 64 位 Ubuntu 上。
    【解决方案2】:

    您可以在此处查看有关如何通过 Amazon EMR 安装和使用 Impala 的详细说明:http://docs.aws.amazon.com/ElasticMapReduce/latest/DeveloperGuide/emr-impala.html

    【讨论】:

    • 无需在 EMR 上安装 Imapala。只需创建一个集群并使用它。
    【解决方案3】:

    EMR 基于在 Debian Squeeze 之上运行的 Amazon Hadoop 发行版。所以,是的,可以使用 Cloudera 的 DEB 存储库。

    您需要通过 SSH 连接到您的 EMR 主节点,在 EMR 控制台上找到地址。

    如果您打算使用外部世界的 JDBC/ODBC 客户端连接到 Impala,您还需要在已分配给 EMR 集群的安全组上启用安全规则。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2020-06-22
      • 1970-01-01
      • 2018-05-12
      相关资源
      最近更新 更多