【问题标题】:name spark is not defined名称 spark 未定义
【发布时间】:2018-02-21 02:11:33
【问题描述】:

尝试按照火花教程,但得到以下错误 -

https://spark.apache.org/docs/latest/quick-start.html

“名称'spark'未定义”

Using Python version 2.6.6 (r266:84292, Nov 22 2013 12:16:22)
SparkContext available as sc.
>>> import pyspark
>>> textFile = spark.read.text("README.md")
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
NameError: name 'spark' is not defined

这就是我开始的方式 -

./bin/pyspark --master local[*]

【问题讨论】:

  • 你的 spark 版本是什么?
  • 版本 - 火花 1.0.1
  • 如果不是 2.0+,请更新到 1.6。这将是一个更轻松的学习体验。 :)

标签: apache-spark pyspark


【解决方案1】:

如果您的 spark 版本是 1.0.1,则不应使用 2.2.0 版本的教程。这些版本之间存在重大变化。

在这个网站上你可以找到Tutorial for 1.6.0

按照 1.6.0 教程,您必须使用 textFile = sc.textFile("README.md") 而不是 textFile = spark.read.text("README.md")

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2019-09-29
    • 2018-01-24
    相关资源
    最近更新 更多