【发布时间】:2016-04-03 08:04:11
【问题描述】:
我刚刚使用 DataProc 在 Google Cloud 中设置了一个 Spark 集群,并且我在单独的 VM 上运行了一个独立安装的 Cassandra。我想安装 Datastax spark-cassandra 连接器,这样我就可以从 spark 连接到 Cassandra。我怎样才能做到这一点 ?
连接器可以在这里下载:
https://github.com/datastax/spark-cassandra-connector
关于构建的说明在这里: https://github.com/datastax/spark-cassandra-connector/blob/master/doc/12_building_and_artifacts.md
需要 sbt 来构建它。
在哪里可以找到用于 DataProc 安装的 sbt?
它会在 $SPARK_HOME/bin 下吗? DataProc 的 spark 安装在哪里?
【问题讨论】:
-
连接器是否需要安装在整个集群上,还是可以通过 spark 包使用(诚然,在 Dataproc 上使用需要一些技巧)?如果软件包足够,请考虑在此问题上使用“简短答案”:stackoverflow.com/questions/33363189/…
标签: apache-spark google-cloud-platform google-cloud-dataproc