【发布时间】:2020-07-06 20:13:32
【问题描述】:
您好,我正在尝试在 jupyter notebook 中运行我的第一个 pyspark 代码。我遇到了问题,因为 SparkContext' 对象没有属性 'prallelize.你能帮帮我吗?
代码如下:
import findspark
findspark.init()
findspark.find()
import pyspark
findspark.find()
给我的结果是:C:\Users\Owner\spark-3.0.0-bin-hadoop2.7\spark-3.0.0-bin-hadoop2.7'--
from pyspark import SparkContext,SparkConf
from pyspark.sql import SparkSession
conf = pyspark.SparkConf().setAppName('SparkApp').setMaster('local')
sc = pyspark.SparkContext(conf=conf)
spark = SparkSession(sc)
myRDD = sc.prallelize([('Ross',19),('Joey',18),('Rachel',16),('Pheobe',18),('Chandler',17),('Monica',20),('Ram',25),('Hari',10)])
上面的代码给了我如下所示的错误: AttributeError: 'SparkContext' 对象没有属性 'prallelize'
【问题讨论】:
标签: python-3.x pyspark