【发布时间】:2018-05-19 19:33:32
【问题描述】:
我搜索了这个问题,但没有与 spark-2.2.0-bin-hadoop2.7 相关的直接答案。我正在尝试从本地目录中读取文本文件,但我总是得到 TypeError that name 参数丢失。这是使用 Python3 的 jupyter notebook 中的代码:
from pyspark import SparkContext as sc
data = sc.textFile("/home/bigdata/test.txt")
当我运行单元格时,我收到此错误:
TypeError Traceback (most recent call last)
<ipython-input-7-2a326e5b8f8c> in <module>()
1 from pyspark import SparkContext as sc
----> 2 data = sc.textFile("/home/bigdata/test.txt")
TypeError: textFile() missing 1 required positional argument: 'name'
感谢您的帮助。
【问题讨论】:
标签: python python-3.x apache-spark pyspark rdd