【发布时间】:2019-02-03 14:30:15
【问题描述】:
我正在使用 Spark/Livy 运行 EMR 集群,并想测试 Spark Structured Streaming。我正在使用 Jupyter Notebook 托管服务(通过 Livy 连接)但是当我在 Jupyter 中尝试此代码时:
query = (wordCounts
.writeStream
.queryName("streamingDF")
.outputMode('complete')
.format('memory')
.start())
我收到以下错误:
调用 o98.start 时出错。 : org.apache.hadoop.security.AccessControlException: 权限被拒绝: user=livy, access=WRITE, inode="/mnt/tmp":hadoop:hadoop:drwxr-xr-x
由于 Livy 似乎正在将临时数据写入 HDFS,我该如何更改权限以及更改权限。 我认为使用“内存”选项它会写入驱动程序而不是磁盘。
【问题讨论】:
-
你找到解决这个问题的方法了吗?我也有同样的问题
标签: apache-spark jupyter-notebook amazon-emr