【发布时间】:2020-05-23 16:39:52
【问题描述】:
我有一个 Cassandra 表,其结构如下:
CREATE TABLE myKeyspace.myTable (
rowkey text,
columnname text,
columnvalue text,
PRIMARY KEY (rowkey, columnname)
)
我希望使用 Spark Cassandra 连接器插入数据。
我的 Spark 数据集类型为 Dataset[Seq[(String, String, String)]]。
我想将其转换为Dataset[(String, String, String)],以便可以使用.rdd.saveToCassandra API 将其插入到表中。
请协助转换,或者是否有直接的方法可以使用相同的Dataset[Seq[(String, String, String)]]。
【问题讨论】:
-
能否添加数据集的printSchema[Seq([String,String,String])]
-
我不确定是否投反对票。我需要一些细节添加评论。
-
你能检查下面的答案,看看它是否有帮助?
标签: scala apache-spark dataset