【发布时间】:2018-08-17 15:26:16
【问题描述】:
请您帮助澄清以下项目:
- Kyro 是否用于持久化 RDD/Dataframe。当我们在persist中选择pass MEMORY_AND_DISK_SER时。
- 如果是 OFF_HEAP,则使用 Tunsten 方法或使用 Kyro。
【问题讨论】:
标签: apache-spark bigdata apache-spark-2.0
请您帮助澄清以下项目:
【问题讨论】:
标签: apache-spark bigdata apache-spark-2.0
Kyro 是否用于持久化 RDD/Dataframe。当我们在persist中选择pass MEMORY_AND_DISK_SER时。
RDD - 是的。DataFrame / Dataset - 否,已使用 Encoders.kryo 序列化的字段除外
在 OFF_HEAP 的情况下,使用 Tunsten 方法或正在使用 Kyro。
没有。
总结一下 - Kryo 从未在 Dataset API 中用于存储。
【讨论】: