【问题标题】:Spark AttributeError: 'SparkContext' object has no attribute 'map'Spark AttributeError:“SparkContext”对象没有属性“地图”
【发布时间】:2015-03-19 21:31:34
【问题描述】:

我在 Hortonworks Data Platform 2.2 上使用 Spark,我收到以下错误...有什么想法吗?

#!/usr/bin/env python

import sys
import pyspark
from pyspark import SparkContext

if 'sc' not in globals():
    #sc = SparkContext('local[4]', 'pyspark','map')
    sc = SparkContext(appName="PythonKMeans")

nums = sc.map([23,232,1,232,43,43])
squared = nums.map(lambda x: x*x).collect()
for num in squared:
    print num

【问题讨论】:

    标签: python linux hadoop apache-spark hortonworks-data-platform


    【解决方案1】:

    代替

    nums = sc.map([23,232,1,232,43,43])
    

    试试

    nums = sc.parallelize([23,232,1,232,43,43])
    

    这告诉 Spark 在集群上分配序列并从中创建一个 RDD。然后,您可以在 RDD 上使用 lambda 函数调用 map,就像在下一行中所做的那样。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2017-05-19
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2012-12-01
      • 2021-04-19
      • 2021-11-22
      相关资源
      最近更新 更多