【问题标题】:How to install and use Mahout for windows?如何安装和使用 Mahout for windows?
【发布时间】:2017-07-18 00:03:05
【问题描述】:

我在 Windows 中的 Spark 中工作。我已经在 Windows 中成功设置了 spark 和环境变量,并且我的程序在 Scala IDE 中运行没有问题。现在我需要使用 Mahout 库函数进行机器学习。我尝试使用此链接使 Mahout 适用于 Windows here,但我没有运气,它不起作用。我的 scala ide 说:“无法从“mahout -spark 类路径”读取输出。SPARK_HOME 设置了吗?”

有人知道如何正确设置 Mahout for windows 吗?提前致谢。

【问题讨论】:

标签: windows scala apache-spark mahout scala-ide


【解决方案1】:

我们 Mahout 项目不直接支持 Windows。 VM 现在是免费的,所以我建议为 Apache 的大多数 JVM(Java 虚拟机)工具安装一个。有些可以在 Window 上运行,但它们都可以在 Linux 上运行。然后安装你可以在生产中使用的`Nix。这有几个好处。

或者,边缘 Windows 有一个新的 Linux 子系统 PowerShell,它允许安装像 Ubuntu 这样的来宾操作系统。这将是一个实验,因为我还没有尝试过。 https://msdn.microsoft.com/en-us/commandline/wsl/install_guide

不确定这是使用容器还是虚拟机技术,但听起来很有希望。

【讨论】:

    【解决方案2】:

    那个链接是多余的。

    如果您尝试在 REPL 环境中在 Spark 上运行 Mahout,您只需 set some env variables.

    你设置了 SPARK_HOME 吗? (试试echo $SPARK_HOME - 我认为这适用于Windows?)

    另一种方法是使用 Apache Zeppelin,恕我直言,这是一种更好的体验。 Tutorial

    我还没有听说有人在 Windows 上使用 Mahout,但它应该是直截了当的。如果/当你得到它的工作 - 请写一个教程,我们将它发布在网站上(我是社区成员),我们可以帮助你,请联系developer email list

    更新

    如果您在运行 bin/mahout 时遇到问题,您可以使用 install Cygwin(从而创建类似 Unix 的环境,或者您可以尝试以下操作:

    export MAHOUT_JARS=$(echo "$MAHOUT_HOME"/*.jar | tr ' ' ',')

    $SPARK_HOME/bin/spark-shell --jars "$MAHOUT_JARS" \
        -i $MAHOUT_HOME/bin/load-shell.scala \ 
        --conf spark.kryo.referenceTracking=false \
        --conf spark.kryo.registrator=org.apache.mahout.sparkbindings.io.MahoutKryoRegistrator \
        --conf spark.kryoserializer.buffer=32k \
        --conf spark.kryoserializer.buffer.max=600m \
        --conf spark.serializer=org.apache.spark.serializer.KryoSerializer
    

    应该使用 Mahout Jars/正确的 spark 配置和 mahout 启动脚本(导入库并设置 Mahout 分布式上下文)启动 spark-shell - 但就个人而言,我推荐 Zeppelin(参见上面的教程链接) .

    【讨论】:

    • 恐怕这并不简单,因为命令/脚本是 bash 脚本并且仅适用于 Linux。该链接为 Windows 提供了一些类似的脚本,但它们现在已经过时了。需要有人更新脚本或其他更简单的方法来使用 Mahout。顺便说一句,我已成功在 windows 中设置环境变量。
    猜你喜欢
    • 2014-01-06
    • 2011-05-03
    • 2017-03-26
    • 1970-01-01
    • 2016-04-22
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2023-04-04
    相关资源
    最近更新 更多