【问题标题】:How Spark writes/reads process through spark-Cassandra connector different from CQLSH read/write processSpark如何通过spark-Cassandra连接器进行与CQLSH读/写过程不同的写/读过程
【发布时间】:2018-04-12 18:40:32
【问题描述】:

我是 spark 新手,试图了解,通过 Cassandra 集群上的 spark-Cassandra 连接器使用 spark 有什么优势。

  1. 如何通过 spark-Cassandra 连接器向 Cassandra 写入(例如 savetocassandra)(spark SQL 查询,是否还涉及协调节点?
  2. 如何通过 spark-Cassandra 连接器(spark SQL 查询)读取 Cassandra,是否还涉及协调节点?
  3. 是什么让 spark 在集群上的高范围读取扫描期间克服了 Cassandra 的负载?
  4. 如何通过 spark-Cassandra 连接器在 Cassandra 集群上执行高范围扫描 cql 读取查询?
  5. 在 Cassandra 集群上通过 spark-Cassandra 连接器使用 IN 子句有优势吗?

【问题讨论】:

    标签: apache-spark nosql datastax-enterprise spark-cassandra-connector cassandra-3.0


    【解决方案1】:

    这是一个很好的解释。如果您想了解 spark-cassandra-connector 内部结构,我还推荐其他 Russell 讲座 Cassandra 和 Spark 优化数据局部性 - Russell Spitzer (DataStax) https://www.youtube.com/watch?v=ikCzILOpYvA

    【讨论】:

      猜你喜欢
      • 2016-06-24
      • 1970-01-01
      • 2017-12-23
      • 2021-05-21
      • 1970-01-01
      • 2018-08-12
      • 2020-05-25
      • 2023-03-10
      • 1970-01-01
      相关资源
      最近更新 更多