【问题标题】:How to do data exploration before choosing any Machine Learning algorithms [closed]在选择任何机器学习算法之前如何进行数据探索[关闭]
【发布时间】:2017-05-23 19:35:58
【问题描述】:

任何工具都可以帮助识别数据分布模式,然后做出选择机器学习算法的决定?

【问题讨论】:

    标签: machine-learning data-science


    【解决方案1】:

    首先,您必须将机器学习理解为一个领域,并对其子领域有所了解。如果您不直观地了解您的工具,您将无法确定何时使用它们。

    您正在谈论的想法称为探索性数据分析,如果您以正确的方式思考它,它可能会非常平易近人。用科学的方法想一想:

    首先,查看数据以及相关文档。

    然后,对可能存在的模式提出一些假设。

    根据您对机器学习的理解,集思广益一些方法,这些方法可能会让您对您的假设有所了解。例如,如果您发现建议的依赖值可能有多个不同的值,则说明存在分类问题,应根据输入数据选择适当的方法。

    您可能会发现有用的工具很多,但一个好的开始可能是编程语言 R 或 Python。两者都是非常强大的数据科学工具。 R 具有更大的学习曲线,但在构建时考虑了数据科学。另一方面,Python 很容易上手,但您可以在 ML 和数据科学库方面做出更多选择。使用 Python,查看 Pandas 进行 CSV 和数据操作,查看 Tensorflow、Theano 或 Scikit-Learn 进行数据分析和机器学习。

    希望这会有所帮助!

    【讨论】:

    • 谢谢!顺便说一句,我将调查 Apache Zeppelin
    猜你喜欢
    • 1970-01-01
    • 2019-10-15
    • 2020-01-25
    • 2012-09-13
    • 1970-01-01
    • 2018-06-28
    • 2016-01-24
    • 2011-06-16
    • 1970-01-01
    相关资源
    最近更新 更多