【问题标题】:Datastax Spark Zeppelin AuthenticationDatastax Spark Zeppelin 身份验证
【发布时间】:2016-09-23 09:32:32
【问题描述】:

我有一个激活了身份验证的 datastax 集群 4.8 (Cassandra + Spark)。我希望能够在我的集群上将notebook Zeppelin 与 Spark 主服务器和我的数据库 Cassandra 一起使用。

我下载了 Zeppelin 的二进制包 0.5.6。我把它放在我的服务器上。如果我使用默认配置启动它(./bin/zeppelin-daemon.sh start),它可以正常工作http://ServerName:8080/#/

但是当我想使用我的 DSE spark master 时,结果输出是:

java.net.ConnectException:连接被拒绝 java.net.PlainSocketImpl.socketConnect(Native Method) 在 java.net.AbstractPlainSocketImpl.doConnect(AbstractPlainSocketImpl.java:344) 在 java.net.AbstractPlainSocketImpl.connectToAddress(AbstractPlainSocketImpl.java:200) 在 java.net.AbstractPlainSocketImpl.connect(AbstractPlainSocketImpl.java:182) 在 java.net.SocksSocketImpl.connect(SocksSocketImpl.java:392) 在 java.net.Socket.connect(Socket.java:579) 在 org.apache.thrift.transport.TSocket.open(TSocket.java:182) 在 org.apache.zeppelin.interpreter.remote.ClientFactory.create(ClientFactory.java:51) 在 org.apache.zeppelin.interpreter.remote.ClientFactory.create(ClientFactory.java:37) 在 org.apache.commons.pool2.BasePooledObjectFactory.makeObject(BasePooledObjectFactory.java:60) 在 org.apache.commons.pool2.impl.GenericObjectPool.create(GenericObjectPool.java:861) 在 org.apache.commons.pool2.impl.GenericObjectPool.borrowObject(GenericObjectPool.java:435) 在 org.apache.commons.pool2.impl.GenericObjectPool.borrowObject(GenericObjectPool.java:363) 在 org.apache.zeppelin.interpreter.remote.RemoteInterpreterProcess.getClient(RemoteInterpreterProcess.java:139) 在 org.apache.zeppelin.interpreter.remote.RemoteInterpreter.init(RemoteInterpreter.java:129) 在 org.apache.zeppelin.interpreter.remote.RemoteInterpreter.getFormType(RemoteInterpreter.java:257) 在 org.apache.zeppelin.interpreter.LazyOpenInterpreter.getFormType(LazyOpenInterpreter.java:104) 在 org.apache.zeppelin.notebook.Paragraph.jobRun(Paragraph.java:198) 在 org.apache.zeppelin.scheduler.Job.run(Job.java:169) 在 org.apache.zeppelin.scheduler.RemoteScheduler$JobRunner.run(RemoteScheduler.java:322) 在 java.util.concurrent.Executors$RunnableAdapter.call(Executors.java:471) 在 java.util.concurrent.FutureTask.run(FutureTask.java:262) 在 java.util.concurrent.ScheduledThreadPoolExecutor$ScheduledFutureTask.access$201(ScheduledThreadPoolExecutor.java:178) 在 java.util.concurrent.ScheduledThreadPoolExecutor$ScheduledFutureTask.run(ScheduledThreadPoolExecutor.java:292) 在 java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1145) 在 java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:615) 在 java.lang.Thread.run(Thread.java:745)

笔记本似乎无法连接到我通常使用的 spark-master

$> dse -u "用户名" -p "密码" spark

我不确定这是问题所在,但我不知道在哪里设置这些参数 xD。

有关信息,我将 /zeppelin-0.5.6-incubating-bin-all/conf/zeppelin-env.sh 设置为:

  • export MASTER=spark://ip_of_my_server:7077

  • export ZEPPELIN_MEM=-Xmx5g 正如Hello world in zeppelin failed 中提到的拉取请求ZEPPELIN-305 中所建议的那样(但我认为这不是问题,因为此请求已在0.5.6 中关闭)

  • export SPARK_HOME=/usr/share/dse/spark 包含:

垃圾箱
数据

蟒蛇
发布
sbin
火花作业服务器

我虽然在解释器界面的“master”字段中输入了“spark://ip_of_my_server:7077”。

那么你有什么想法可以解决我的问题并连接 DSE spark 和 zeppelin :)?

【问题讨论】:

  • 我在 zeppelin-root-labgsd2t.out 中找到:Failed to find Spark assembly in /usr/share/dse/spark/lib. You need to build Spark before running this program. 那么你知道 DSE 的 Spark 组件在哪里吗?

标签: apache-spark connection datastax apache-zeppelin


【解决方案1】:

在与 Datastax 专家Duy Hai Doan进行了一些交流后

我得到了解决方案,我建议你去他的博客http://www.doanduyhai.com/blog/?p=2325

对于身份验证细节,转到解释器参数并添加:

  • 对于 Cassandra

cassandra.hosts : "YourNodeIP"

cassandra.credentials.username : "你的用户名"

cassandra.credentials.password : "你的密码"


  • 对于 Spark

spark.cassandra.auth.password : "你的密码"

spark.cassandra.auth.username : "你的用户名"

spark.cassandra.connection.host : "YourSparkMasterIP"

非常感谢 Datastax 和 Duy

【讨论】:

    猜你喜欢
    • 2017-01-09
    • 2020-04-14
    • 2017-04-06
    • 1970-01-01
    • 2021-04-05
    • 2017-07-23
    • 2017-02-20
    • 2017-05-29
    • 2018-06-03
    相关资源
    最近更新 更多