【发布时间】:2015-02-19 23:30:15
【问题描述】:
有人知道如何为 hdisights 创建动作脚本吗?我现在使用actoinscript 安装spark 1.0.2,但希望集群上的spark 1.2.x 获得更多hive 支持。当我尝试通过修改 Microsoft 提供的操作脚本来创建具有 1.2 的 spark 集群时,我已经阅读了 Script Action Development with HDInsight。这样做之后,我收到一个错误,即 spark 不理解文件 url 'wasb://',并且它需要采用'hdfs://'格式。在文章中它谈到了Configure the custom components to use WASB,它说:
The custom components that you install on the cluster nodes might have a
default configuration to use HDFS storage. You should change the
configuration to use Azure Storage Blob (WASB) instead. On a cluster
re-image, the HDFS file system gets formatted and you would lose any data
that is stored there. Using WASB instead ensures that your data will be
retained.
对我来说,这似乎与我遇到的错误有关。有谁知道如何编译支持(WASB)的火花或如何配置它?
【问题讨论】:
标签: azure hadoop apache-spark hdfs azure-hdinsight