【发布时间】:2020-10-07 05:16:55
【问题描述】:
我已将 pyspark_python 设置为 python3,我想在 Spark RDD 上执行 NLTK。 但是在执行 NLTK 时,它显示在错误下方。
File "/home/user/.local/lib/python3.6/site-packages/nltk/corpus/reader/wordnet.py", line 1881, in <listcomp>
if form.endswith(old)
TypeError: endswith first arg must be bytes or a tuple of bytes, not str
当我在 HDP 集群上运行 spark 应用程序时效果很好,但在本地系统 spark-submit 上不起作用。
【问题讨论】:
-
可以发布创建
form和old变量的代码吗?
标签: apache-spark pyspark nltk