【发布时间】:2019-02-02 16:44:45
【问题描述】:
当我将 pyarrow 设置为 true 时,我们使用 spark session,但是当我运行 toPandas() 时,它会抛出错误:
"toPandas attempted Arrow optimization because 'spark.sql.execution.arrow.enabled' is set to true. Please set it to false to disable this"
我可以知道为什么会这样吗?
【问题讨论】:
-
你的数据框中的数据类型是什么?请记住,并非所有类型的数据都支持。 arrow.apache.org/blog/2017/07/26/spark-arrow - 检查使用说明。
-
还有source code这样说:
spark.sql.execution.arrow.enabled=True is experimental