【发布时间】:2019-07-19 02:35:15
【问题描述】:
我正在使用带有 spark-cassandra-connector 的 Spark 1.2.1:
//join with cassandra
val rdd = some_array.map(x => SomeClass(x._1,x._2)).joinWithCassandraTable(keyspace, some_table)
println(timer, "Join")
//get only the jsons and create rdd temp table
val jsons = rdd.map(_._2.getString("this"))
val jsonSchemaRDD = sqlContext.jsonRDD(jsons)
jsonSchemaRDD.registerTempTable("this_json")
println(timer, "Map")
输出是:
Timer "Join"- 558 ms
Timer "Map"- 290284 ms
我猜“joinWithCassandraTable()”函数是惰性的,如果是这样,什么是启动它?
【问题讨论】:
-
那是 Spark 的真正旧版本!
-
是的,我需要升级dse版本。
标签: apache-spark cassandra spark-cassandra-connector