【发布时间】:2019-04-20 17:26:54
【问题描述】:
在 Windows 中,当我启动我的 pyspark shell 时,我收到了错误:
2019-04-20 08:11:34 ERROR Shell:397 - Failed to locate the winutils binary in the hadoop binary path
java.io.IOException: Could not locate executable null\bin\winutils.exe in the Hadoop binaries.
但是,在该错误之后,我的 pyspark shell 启动正常,并且我在运行 pyspark 和在其上运行代码时没有问题。但是,我每次都会收到此错误,我不知道如何摆脱它。
我的环境变量设置正确(就像许多人针对这个问题提出的建议一样),并且我在正确的 bin 文件夹中有 winutils.exe。 (我在 Hadoop 的相应 bin 文件夹中也有 winutils.exe 和 hadoop.dll)。我相信如果没有设置这些东西,pyspark shell 甚至都不会工作。
作为参考,我的环境变量设置为:
- HADOOP_HOME: C:\hadoop
- SPARK_HOME:C:\Spark\spark-2.3.3-bin-hadoop2.7
- 在我放置的路径中:C:\Spark\spark-2.3.3-bin-hadoop2.7 和 C:\hadoop\bin。
我为系统变量(除了用户变量)放置了相同的变量。
Hadoop 也可以正常工作并启动(除了显示 50070 UI,而它显示 8080 UI,尽管这可能是一个单独的问题)。
这可能只是一个不会消失的缓存错误吗?有什么建议可以摆脱它吗?谢谢!
【问题讨论】:
标签: python windows hadoop pyspark