Spark如何通过spark-Cassandra连接器进行与CQLSH读/写过程不同的写/读过程答案

【问题标题】：How Spark writes/reads process through spark-Cassandra connector different from CQLSH read/write processSpark如何通过spark-Cassandra连接器进行与CQLSH读/写过程不同的写/读过程
【发布时间】：2018-04-12 18:40:32
【问题描述】：

我是 spark 新手，试图了解，通过 Cassandra 集群上的 spark-Cassandra 连接器使用 spark 有什么优势。

如何通过 spark-Cassandra 连接器向 Cassandra 写入（例如 savetocassandra）（spark SQL 查询，是否还涉及协调节点？
如何通过 spark-Cassandra 连接器（spark SQL 查询）读取 Cassandra，是否还涉及协调节点？
是什么让 spark 在集群上的高范围读取扫描期间克服了 Cassandra 的负载？
如何通过 spark-Cassandra 连接器在 Cassandra 集群上执行高范围扫描 cql 读取查询？
在 Cassandra 集群上通过 spark-Cassandra 连接器使用 IN 子句有优势吗？

【问题讨论】：

标签： apache-spark nosql datastax-enterprise spark-cassandra-connector cassandra-3.0

【解决方案1】：

这是一个很好的解释。如果您想了解 spark-cassandra-connector 内部结构，我还推荐其他 Russell 讲座 Cassandra 和 Spark 优化数据局部性 - Russell Spitzer (DataStax) https://www.youtube.com/watch?v=ikCzILOpYvA

【讨论】：