【问题标题】:Zeppelin+Spark+Cassandra: Spark dont workZeppelin+Spark+Cassandra:Spark 不工作
【发布时间】:2022-12-12 13:54:49
【问题描述】:

观看了一个关于 Zeppelin+Spark+Cassandra 的不错的 youtube 视频。试图重复。操作系统 Win10。

  1. 像 docker 镜像一样运行 Zeppelin;

  2. Cassandra Interpreters 的设置选项,它可以工作

  3. 现在尝试设置 Spark,但我不能。安装了 spark-3.0.1-bin-hadoop2.7(文件夹名为 spark-3.0.1-bin-hadoop2.7,没问题),cmd 中的 spark-shell 有效。我与spark-cassandra-connector 有什么关系,我必须为 spark Interpreter 设置哪些选项?谢谢。

    org.apache.zeppelin.interpreter.InterpreterException: java.io.IOException: Fail to detect scala version,原因是:Cannot run program "C:/bin/spark-3.3.1-bin-hadoop3/bin/spark-submit ": error=2, 没有那个文件或目录 在 org.apache.zeppelin.interpreter.remote.RemoteInterpreter.open(RemoteInterpreter.java:129) 在 org.apache.zeppelin.interpreter.remote.RemoteInterpreter.getFormType(RemoteInterpreter.java:271) 在 org.apache.zeppelin.notebook.Paragraph.jobRun(Paragraph.java:438) 在 org.apache.zeppelin.notebook.Paragraph.jobRun(Paragraph.java:69) 在 org.apache.zeppelin.scheduler.Job.run(Job.java:172) 在 org.apache.zeppelin.scheduler.AbstractScheduler.runJob(AbstractScheduler.java:132) 在 org.apache.zeppelin.scheduler.RemoteScheduler$JobRunner.run(RemoteScheduler.java:182) 在 java.util.concurrent.Executors$RunnableAdapter.call(Executors.java:511) 在 java.util.concurrent.FutureTask.run(FutureTask.java:266) 在 java.util.concurrent.ScheduledThreadPoolExecutor$ScheduledFutureTask.access$201(ScheduledThreadPoolExecutor.java:180) 在 java.util.concurrent.ScheduledThreadPoolExecutor$ScheduledFutureTask.run(ScheduledThreadPoolExecutor.java:293) 在 java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1149) 在 java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624) 在 java.lang.Thread.run(Thread.java:748) Caused by: java.io.IOException: Fail to detect scala version,原因是:Cannot run program "C:/bin/spark-3.3.1-bin-hadoop3/bin/spark-submit": error=2, No这样的文件或目录 在 org.apache.zeppelin.interpreter.launcher.SparkInterpreterLauncher.buildEnvFromProperties(SparkInterpreterLauncher.java:127) 在 org.apache.zeppelin.interpreter.launcher.StandardInterpreterLauncher.launchDirectly(StandardInterpreterLauncher.java:77) 在 org.apache.zeppelin.interpreter.launcher.InterpreterLauncher.launch(InterpreterLauncher.java:110) 在 org.apache.zeppelin.interpreter.InterpreterSetting.createInterpreterProcess(InterpreterSetting.java:856) 在 org.apache.zeppelin.interpreter.ManagedInterpreterGroup.getOrCreateInterpreterProcess(ManagedInterpreterGroup.java:66) 在 org.apache.zeppelin.interpreter.remote.RemoteInterpreter.getOrCreateInterpreterProcess(RemoteInterpreter.java:104) 在 org.apache.zeppelin.interpreter.remote.RemoteInterpreter.internal_create(RemoteInterpreter.java:154) 在 org.apache.zeppelin.interpreter.remote.RemoteInterpreter.open(RemoteInterpreter.java:126) ... 13 更多

【问题讨论】:

    标签: apache-spark apache-zeppelin


    【解决方案1】:

    好的伙计们,我们开始吧:

    1. Win10安装Spark,网上教程很多
    2. 使用 Zeppelin 下载 docker 镜像
    3. 在带有 Spark 的图像设置设置路径文件夹中,启动它 http://localhost:8080/
    4. Spark 解释器设置:设置 SPARK_HOME,就像在前一点 3 中一样,spark.jars.packages = com.datastax.spark:spark-cassandra-connector_2.12:3.0.1。为 Cassandra 添加设置:spark.cassandra.connection.host、spark.cassandra.auth.username、spark.cassandra.auth.password。
    5. 欢迎

    【讨论】:

      猜你喜欢
      • 2016-01-13
      • 2018-10-13
      • 2016-11-11
      • 2016-03-21
      • 2018-10-29
      • 2017-05-09
      • 2020-10-08
      • 2017-05-12
      • 2020-09-01
      相关资源
      最近更新 更多