【发布时间】:2019-12-30 18:16:15
【问题描述】:
我们有一个包含 50 多列的 Cassandra 架构,我们通过使用 Spark 转换数据(数据帧不是 rdd)将来自多个数据源的数据插入其中。
由于我们的数据稀疏,我们遇到了许多墓碑的问题。
已经尝试过spark.cassandra.output.ignoreNulls=true,但它不起作用。在 cassandra 中不写入空值的正确配置是什么?
我正在使用 zeppelin 运行我的 spark 代码并将数据推送到 C*
【问题讨论】:
标签: dataframe apache-spark cassandra datastax connector