【发布时间】:2016-10-26 00:07:40
【问题描述】:
我是 Spark 世界的新手。我们如何持久化 Dataframe,以便我们可以跨组件使用它。
我有一个 Kafka 流,我通过 Rdd.Tried RegisterAsTempTable 从中生成数据帧,但在另一个程序中无法访问该表。
我想通过sqlContext访问另一个类中的这个Dataframe,并使用查询结果做进一步的计算。
【问题讨论】:
标签: scala apache-spark apache-spark-sql spark-streaming spark-dataframe