【发布时间】:2016-05-07 23:07:33
【问题描述】:
当我尝试运行 spark-steaming 的示例代码时:“kafka_wordcount.py” 文件夹下:/usr/local/spark/examples/src/main/python/streaming
代码将执行代码的指令明确描述为:
" $ bin/spark-submit --jars \
external/kafka-assembly/target/scala-*/spark-streaming-kafka-assembly-*.jar \
examples/src/main/python/streaming/kafka_wordcount.py \
localhost:2181 test
test 是主题名称。但我找不到罐子和路径:
" external/kafka-assembly/target/scala-/spark-streaming-kafka-assembly-.jar"
因此,我创建了一个文件夹“streaming/jar/”并将所有 jars 从 网站http://search.maven.org/#search%7Cga%7C1%7Ca%3A%22spark-streaming-kafka-assembly_2.10%22 然后当我运行时
“park-submit --jars ~/stream-example/jars/spark-streaming-kafka-assembly_*.jar kafka_wordcount.py localhost:2181 主题”
显示
"错误:JAR 中没有设置主类;请用 --class 指定一个 使用 --help 运行以获取使用帮助或 --verbose 用于调试输出"
这有什么问题?罐子在哪里?
非常感谢!!
【问题讨论】:
标签: jar apache-kafka pyspark