【发布时间】:2020-05-28 22:27:34
【问题描述】:
尝试从 DataBricks 读取我在 blob 存储中的数据
spark.conf.set(
"fs.azure.account.key.ACCOUNTNAME.blob.core.windows.net",
"MYKEY")
这应该允许连接到我的存储 blob
那么,根据documentation,应该很容易访问我的blob中的文件。
我尝试了很多东西,没有任何效果
一个例子
blob_url = "https://ACCOUNTNAME.blob.core.windows.net/BLOBNAME/PATH/file"
df=pd.read_csv(blob_url)
返回
HTTP 错误 404:指定的资源不存在。
有什么想法吗?如果需要,我可以通过错误消息显示我的所有尝试
另一个错误
%scala
dbutils.fs.ls("wasbs://ACCOUNTNAME@BLOBNAME.blob.core.windows.net/PATH")
shaded.databricks.org.apache.hadoop.fs.azure.AzureException:shaded.databricks.org.apache.hadoop.fs.azure.AzureException:找不到帐户 ACCOUNTNAME.blob.core.windows.net 中的容器 BLOBNAME ,并且我们无法使用匿名凭据创建它,并且在配置中找不到它们的凭据。
【问题讨论】:
标签: python azure blob databricks azure-databricks