【发布时间】:2023-04-02 05:50:01
【问题描述】:
我正在通过命令运行一个py文件:
/opt/cloudera/parcels/SPARK2-2.2.0.cloudera2-1.cdh5.12.0.p0.232957/bin/spark2-submit --jars /home/jsonnt200/geomesa-hbase-spark-runtime_2.11-1.3.5.1cc.jar,/ccri/hbase-site.zip geomesa_klondike_enrichment2.py
这会导致以下错误:
Traceback(最近一次调用最后一次):文件 “/home/jsonnt200/geomesa_klondike_enrichment2.py”,第 6306 行,在 df2_500m.write.option('header', 'true').csv('/user/jsonnt200/klondike_201708_1m_500meter_testEQ_union4') 文件 "/opt/cloudera/parcels/SPARK2-2.1.0.cloudera2-1.cdh5.7.0.p0.171658/lib/spark2/python/pyspark/sql/readwriter.py", 第 711 行,在 csv 中 self._jwrite.csv(路径)文件“/opt/cloudera/parcels/SPARK2-2.1.0.cloudera2-1.cdh5.7.0.p0.171658/lib/spark2/python/lib/py4j-0.10.4-src .zip/py4j/java_gateway.py", 第 1133 行,在 call 文件中 "/opt/cloudera/parcels/SPARK2-2.1.0.cloudera2-1.cdh5.7.0.p0.171658/lib/spark2/python/pyspark/sql/utils.py", 第 79 行,在装饰中 raise IllegalArgumentException(s.split(': ', 1)[1], stackTrace) pyspark.sql.utils.IllegalArgumentException: u'Illegal pattern 组件:XXX'
最大的担忧是如果我通过 ipython 提交这个相同的 py 文件,它会正常运行。关于可能是什么问题的任何想法?不幸的是,我必须使用 spark2-submit 进行隧道传输。
【问题讨论】: