【问题标题】:How Kyro is being used in Spark 2.X在 Spark 2.X 中如何使用 Kyro
【发布时间】:2018-08-17 15:26:16
【问题描述】:

请您帮助澄清以下项目:

  • Kyro 是否用于持久化 RDD/Dataframe。当我们在persist中选择pass MEMORY_AND_DISK_SER时。
  • 如果是 OFF_HEAP,则使用 Tunsten 方法或使用 Kyro。

【问题讨论】:

    标签: apache-spark bigdata apache-spark-2.0


    【解决方案1】:

    Kyro 是否用于持久化 RDD/Dataframe。当我们在persist中选择pass MEMORY_AND_DISK_SER时。

    • RDD - 是的。
    • DataFrame / Dataset - 否,已使用 Encoders.kryo 序列化的字段除外

    在 OFF_HEAP 的情况下,使用 Tunsten 方法或正在使用 Kyro。

    没有。

    总结一下 - Kryo 从未在 Dataset API 中用于存储。

    【讨论】:

    • 你能分享一些相同的参考文件
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2016-12-24
    • 1970-01-01
    • 1970-01-01
    • 2018-10-05
    • 1970-01-01
    • 2021-09-10
    相关资源
    最近更新 更多