【发布时间】:2019-04-03 01:23:38
【问题描述】:
我正在使用带有 Cassandra 3.x 的 spark-sql_2.11-2.3.1 版本。 我需要提供一个具有
的验证功能 column_family_name text,
oracle_count bigint,
cassandra_count bigint,
create_timestamp timestamp,
last_update_timestamp timestamp,
update_user text
同样,我需要计算成功插入的记录数,即要填充的 cassandra_count,因为我想使用 spark 累加器。但不幸的是,我无法使用 spark-sql_2.11-2.3.1 版本找到所需的 API 示例。
以下是我保存到 cassandra sn-p 的内容
o_model_df.write.format("org.apache.spark.sql.cassandra")
.options(Map( "table" -> columnFamilyName, "keyspace" -> keyspace ))
.mode(SaveMode.Append)
.save()
这里如何为成功保存到 Cassandra 中的每一行实现累加器增量 ...
任何帮助将不胜感激。
【问题讨论】:
标签: apache-spark cassandra apache-spark-sql databricks spark-cassandra-connector