Zeppelin+Spark+Cassandra：Spark 不工作答案

【问题标题】：Zeppelin+Spark+Cassandra: Spark dont workZeppelin+Spark+Cassandra：Spark 不工作
【发布时间】：2022-12-12 13:54:49
【问题描述】：

观看了一个关于 Zeppelin+Spark+Cassandra 的不错的 youtube 视频。试图重复。操作系统 Win10。

像 docker 镜像一样运行 Zeppelin；
Cassandra Interpreters 的设置选项，它可以工作
现在尝试设置 Spark，但我不能。安装了 spark-3.0.1-bin-hadoop2.7（文件夹名为 spark-3.0.1-bin-hadoop2.7，没问题），cmd 中的 spark-shell 有效。我与spark-cassandra-connector 有什么关系，我必须为 spark Interpreter 设置哪些选项？谢谢。

org.apache.zeppelin.interpreter.InterpreterException: java.io.IOException: Fail to detect scala version，原因是：Cannot run program "C:/bin/spark-3.3.1-bin-hadoop3/bin/spark-submit ": error=2, 没有那个文件或目录在 org.apache.zeppelin.interpreter.remote.RemoteInterpreter.open(RemoteInterpreter.java:129) 在 org.apache.zeppelin.interpreter.remote.RemoteInterpreter.getFormType（RemoteInterpreter.java:271）在 org.apache.zeppelin.notebook.Paragraph.jobRun（Paragraph.java:438）在 org.apache.zeppelin.notebook.Paragraph.jobRun（Paragraph.java:69）在 org.apache.zeppelin.scheduler.Job.run(Job.java:172) 在 org.apache.zeppelin.scheduler.AbstractScheduler.runJob（AbstractScheduler.java:132）在 org.apache.zeppelin.scheduler.RemoteScheduler$JobRunner.run(RemoteScheduler.java:182) 在 java.util.concurrent.Executors$RunnableAdapter.call(Executors.java:511) 在 java.util.concurrent.FutureTask.run（FutureTask.java:266）在 java.util.concurrent.ScheduledThreadPoolExecutor$ScheduledFutureTask.access$201(ScheduledThreadPoolExecutor.java:180) 在 java.util.concurrent.ScheduledThreadPoolExecutor$ScheduledFutureTask.run(ScheduledThreadPoolExecutor.java:293) 在 java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1149) 在 java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624) 在 java.lang.Thread.run(Thread.java:748) Caused by: java.io.IOException: Fail to detect scala version，原因是：Cannot run program "C:/bin/spark-3.3.1-bin-hadoop3/bin/spark-submit": error=2, No这样的文件或目录在 org.apache.zeppelin.interpreter.launcher.SparkInterpreterLauncher.buildEnvFromProperties（SparkInterpreterLauncher.java:127）在 org.apache.zeppelin.interpreter.launcher.StandardInterpreterLauncher.launchDirectly（StandardInterpreterLauncher.java:77）在 org.apache.zeppelin.interpreter.launcher.InterpreterLauncher.launch（InterpreterLauncher.java:110）在 org.apache.zeppelin.interpreter.InterpreterSetting.createInterpreterProcess（InterpreterSetting.java:856）在 org.apache.zeppelin.interpreter.ManagedInterpreterGroup.getOrCreateInterpreterProcess(ManagedInterpreterGroup.java:66) 在 org.apache.zeppelin.interpreter.remote.RemoteInterpreter.getOrCreateInterpreterProcess(RemoteInterpreter.java:104) 在 org.apache.zeppelin.interpreter.remote.RemoteInterpreter.internal_create（RemoteInterpreter.java:154）在 org.apache.zeppelin.interpreter.remote.RemoteInterpreter.open(RemoteInterpreter.java:126) ... 13 更多

【问题讨论】：

标签： apache-spark apache-zeppelin

【解决方案1】：

好的伙计们，我们开始吧：

Win10安装Spark，网上教程很多
使用 Zeppelin 下载 docker 镜像
在带有 Spark 的图像设置设置路径文件夹中，启动它 http://localhost:8080/
Spark 解释器设置：设置 SPARK_HOME，就像在前一点 3 中一样，spark.jars.packages = com.datastax.spark:spark-cassandra-connector_2.12:3.0.1。为 Cassandra 添加设置：spark.cassandra.connection.host、spark.cassandra.auth.username、spark.cassandra.auth.password。
欢迎

【讨论】：