【发布时间】:2016-05-02 15:45:56
【问题描述】:
我已经使用Install and use Spark 1.0 on HDInsight Hadoop clusters 中所述的脚本操作 创建了一个带有Apache Spark 的HDInsight 群集:
您可以使用 脚本操作 集群自定义在 Hadoop on HDInsight 中的任何类型的集群上安装 Spark。脚本操作允许您仅在创建集群时运行脚本来自定义集群。如需更多信息,请参阅Customize HDInsight cluster using script action。
我已经运行了一个基本的 Python(字数统计示例)脚本,但是当我启动一个使用 NumPy 的 Python 脚本时,我收到了这个导入器错误:'No module named numpy' 在节点上引发。
为什么我不能导入包,因为 NumPy 是(应该是)开箱即用地安装在 HDInsight 群集上的?有没有办法在节点上安装 NumPy? HDInsight 不允许您对节点进行任何访问。
【问题讨论】:
标签: python azure apache-spark azure-hdinsight