【发布时间】:2015-12-16 01:03:35
【问题描述】:
这是我正在关注的教程中的确切代码。我的同学使用相同的代码没有得到这个错误:
ImportError Traceback (most recent call last)
<ipython-input-1-c6e1bed850ab> in <module>()
----> 1 from pyspark import SparkContext
2 sc = SparkContext('local', 'Exam_3')
3
4 from pyspark.sql import SQLContext
5 sqlContext = SQLContext(sc)
ImportError: No module named pyspark
这是代码:
from pyspark import SparkContext
sc = SparkContext('local', 'Exam_3')
from pyspark.sql import SQLContext
sqlContext = SQLContext(sc)
data = sc.textFile("exam3")
parsedData = data.map(lambda line: [float(x) for x in line.split(',')])
retail = sqlContext.createDataFrame(parsedData,
['category_name','product_id', 'product_name', 'product_price'])
retail.registerTempTable("exam3")
print parsedData.take(3)
【问题讨论】:
-
你安装了 pyspark 模块吗? spark.apache.org/downloads.html
-
应该是。我从全班都在使用的虚拟机上运行它。只有另外一个人有同样的问题,这是因为他们没有加载配置文件,但在我的情况下,我确实加载了配置文件。