【问题标题】:Spark with Cassandra configuration使用 Cassandra 配置的 Spark
【发布时间】:2014-04-28 09:16:44
【问题描述】:

在 cassandra 上运行 spark 得到 TTransportException。谁能告诉我,我必须进行任何配置才能通过 spark 访问 cassandra db 吗?
我将以下变量设置为 .bashrc & conf/spark-env.sh 文件:

export SCALA_HOME=/opt/scala-2.10.3  
export SCALA_LIBRARY_PATH=/opt/scala-2.10.3/lib  
export MAVEN_OPTS="-Xmx1300M -XX:MaxPermSize=512M -XX:ReservedCodeCacheSize=512m"  
export SPARK_HOME=/opt/spark-0.9.0  
export SPARK_CONF_DIR="$SPARK_HOME/conf"  
export SPARK_LOCAL_IP=192.168.140.35  
export SPARK_MASTER_IP=192.168.140.35  
export SPARK_MASTER_PORT=7077  
export SPARK_WORKER_MEMORY=1g  
export SPARK_MASTER_WEBUI_PORT=7123  
export SPARK_WORKER_PORT=8077  
export SPARK_WORKER_DIR=$SPARK_HOME/work  
export SPARK_WORKER_CORES=1  
export SPARK_WORKER_WEBUI_PORT=7456  
export SPARK_WORKER_INSTANCES=1  
export SPARK_CLASSPATH=/opt/cassandra/lib/apache-cassandra-1.2.12-    SNAPSHOT.jar:/opt/cassandra/lib/apache-cassandra-clientutil-1.2.12-SNAPSHOT.jar:/opt/cassandra/lib/apache-cassandra-thrift-1.2.12-SNAPSHOT.jar:/opt/cassandra/lib/commons-cli-1.1.jar:/opt/cassandra/lib/commons-codec-1.2.jar:/opt/cassandra/lib/commons-lang-2.6.jar:/opt/cassandra/lib/compress-lzf-0.8.4.jar:/opt/cassandra/lib/cql-internal-only-1.4.1.zip:/opt/cassandra/lib/high-scale-lib-1.1.2.jar:/opt/cassandra/lib/jackson-core-asl-1.9.2.jar:/opt/cassandra/lib/jackson-mapper-asl-1.9.2.jar:/opt/cassandra/lib/amm-0.2.5.jar:/opt/cassandra/lib/jbcrypt-0.3m.jar:/opt/cassandra/lib/jline-1.0.jar:/opt/cassandra/lib/json-simple-1.1.jar:/opt/cassandra/lib/libthrift-0.7.0.jar:/opt/cassandra/lib/log4j-1.2.16.jar:/opt/cassandra/lib/lz4-1.1.0.jar:/opt/cassandra/lib/metrics-core-2.2.0.jar:/opt/cassandra/lib/netty-3.6.6.Final.jar:/opt/cassandra/lib/servlet-api-2.5-20081211.jar:/opt/cassandra/lib/slf4j-api-1.7.2.jar:/opt/cassandra/lib/lf4j-log4j12-1.7.2.jar:/opt/cassandra/lib/snakeyaml-1.6.jar:/opt/cassandra/lib/snappy-java-1.0.5.jar:/opt/cassandra/lib/snaptree-0.1.jar  
export PATH=$PATH:$M2:$JAVA_HOME/bin:$HADOOP_HOME/bin:$CASSANDRA_HOME/bin:$SQOOP_HOME/bin:$OOZIE_HOME/bin:$PIG_HOME/bin:$HIVE_HOME/bin:$ANT_HOME/bin:$SCALA_HOME/bin

【问题讨论】:

    标签: cassandra apache-spark


    【解决方案1】:

    看看这个库 http://tuplejump.github.io/calliope/ 用于 spark cassandra 集成。DataStax 还发布了一个 Spark 驱动程序,可以在这里找到 https://github.com/datastax/spark-cassandra-connector

    【讨论】:

      【解决方案2】:

      我已经成功尝试了这个blog 指令。

      测试愉快!

      编辑:抱歉,实际上我已经尝试在给定的博客文章和来自shark 的非常简单的文档之间进行组合。

      【讨论】:

      • 这个博客是针对 cassandra 的 hive 而不是针对 cassandra 的 spark,我找不到这个博客的第二部分。如果您知道本博客的第二部分,请告诉我链接。
      • 刚刚编辑了我的帖子。对不起!我实际上也被卡住了,但使用的是 datastax 发行版。
      • 我问的是 cassandra 的火花,而不是蜂巢的鲨鱼。
      • 好吧,据我了解,您在中间仍然需要 hadoop (hdfs)。另外,你是如何进行测试的?您在哪里/何时收到异常?
      • 在执行下面的命令时,我得到了异常,为了您的信息,master & worker 运行正常。/bin/run-example fullyqualifiedPackageName.ClassName arguments
      猜你喜欢
      • 2020-04-18
      • 2017-10-03
      • 2017-02-27
      • 2017-10-24
      • 2019-10-28
      • 2017-03-05
      • 2016-09-02
      • 2017-07-25
      • 2017-09-14
      相关资源
      最近更新 更多