【发布时间】:2011-12-16 21:00:34
【问题描述】:
最近我看了很多斯坦福搞笑的Open Classroom's视频讲座。特别是关于无监督机器学习的部分引起了我的注意。不幸的是,如果它可能变得更有趣,它就会停止。
基本上,我希望通过无监督算法对离散矩阵进行分类。这些矩阵只包含相同范围的离散值。假设我有 1000 个 20x15 矩阵,其值范围为 1-3。我刚开始阅读文献,我觉得图像分类要复杂得多(颜色直方图),而且我的案例只是对那里所做的事情的简化。
我还查看了Machine Learning 和Cluster Cran 任务视图,但不知道从哪里开始使用实际示例。
所以我的问题是:哪个包/算法将是开始在 R 中尝试和解决问题的好选择?
编辑: 我意识到我可能不够精确:我的矩阵包含离散选择数据——所以平均聚类可能(!)不是正确的想法。我确实理解你所说的关于向量和观察的内容,但我希望有一些函数可以接受矩阵或 data.frames,因为随着时间的推移我有几个观察结果。
编辑2: 我意识到,专注于分类数据的无监督分类的包/功能介绍是目前对我最有帮助的。
【问题讨论】:
-
kmeansinlibrary(class)和hclust- 这是两个基本的。 -
这也适用于分类数据吗?
-
@ran2:任何聚类算法都适用于具有正确设置的分类数据。使用 1-of-K 编码是个好主意,如果您的聚类包提供多个距离指标,您可能想尝试 L1 距离而不是欧几里得。
-
@larsmans,谢谢!您对刚刚解释的内容有很好的阅读/开始吗?
-
@ran2:我的大部分机器学习知识来自实践和与同事的讨论。不过,我敢打赌,您可以在 ESL 中找到很多信息。
标签: r machine-learning cluster-analysis unsupervised-learning