【发布时间】:2013-06-18 09:13:17
【问题描述】:
有没有我可以安装唯一没有 cloudera 管理器和没有 cdh 的 impala。我将使用 apache 版本的 hadoop?
【问题讨论】:
标签: hadoop hive cloudera amazon-emr impala
有没有我可以安装唯一没有 cloudera 管理器和没有 cdh 的 impala。我将使用 apache 版本的 hadoop?
【问题讨论】:
标签: hadoop hive cloudera amazon-emr impala
是的,这是绝对可能的。将存储库添加到您的 sources.list 文件中,然后更新存储库。
deb [arch=amd64] http://archive.cloudera.com/impala/ubuntu/precise/amd64/impala 精确-impala1 贡献 deb-src http://archive.cloudera.com/impala/ubuntu/precise/amd64/impala 精确-impala1 贡献
在那之后,它只是:
sudo apt-get install impala (Binaries for daemons)
sudo apt-get install impala-server (Service start/stop script)
sudo apt-get install impala-state-store (Service start/stop script)
但不要忘记满足所有先决条件。详细信息可以去here
【讨论】:
您可以在此处查看有关如何通过 Amazon EMR 安装和使用 Impala 的详细说明:http://docs.aws.amazon.com/ElasticMapReduce/latest/DeveloperGuide/emr-impala.html
【讨论】:
EMR 基于在 Debian Squeeze 之上运行的 Amazon Hadoop 发行版。所以,是的,可以使用 Cloudera 的 DEB 存储库。
您需要通过 SSH 连接到您的 EMR 主节点,在 EMR 控制台上找到地址。
如果您打算使用外部世界的 JDBC/ODBC 客户端连接到 Impala,您还需要在已分配给 EMR 集群的安全组上启用安全规则。
【讨论】: