我想要可以尝试用于示例实验的预测/预测算法列表[关闭]答案

【问题标题】：I want forecast/ prediction algorithms lists that I can try for the sample experiment [closed]我想要可以尝试用于示例实验的预测/预测算法列表[关闭]
【发布时间】：2011-09-14 06:29:06
【问题描述】：

我想知道我可以做实验的算法列表，以根据一组输入预测患者患癌症或发烧或其他疾病的概率...请假设我有数百万的数据，所以我想尝试预测的最佳算法...我对数据挖掘和机器学习真的很陌生....

【问题讨论】：

我对算法一无所知，但可能知道的人需要更多信息。例如输入示例等？也许描述一个测试用例？

标签： machine-learning data-mining prediction

【解决方案1】：

目前最流行的预测和分类算法之一是 Leo Breiman 的Random Forests (RF)。它的实现也可以在 weka 中使用。

【讨论】：

【解决方案2】：

如果您专门研究估计某事的概率，那么您需要使用生成概率的机器学习方法。大多数只生成一个类标签：是/否。

最知名的概率估计算法是逻辑回归。 Weka 中提供了一个实现。

【讨论】：

Weka 有 J48 决策树，它比癌症数据的逻辑回归具有更好的准确性。根据数据，您需要测试不同的算法并应用。看看你是否没有过度拟合。

【解决方案3】：

使用大量机器学习库开始实验的最流行工具是Weka。在这里，您可以上传您的数据并尝试多种算法。它的弱点是可扩展性，但处理数据不是问题。

【讨论】：

【解决方案4】：

这个问题有点模糊，我只能给出一个模糊的答案：使用全能的SVM！将数百万个输入向量提供给 SVM 分类器，它应该能够在之后为您提供最先进的预测。

如果您正在寻找 SVM 的实现，请查看 libsvm，它包含几乎所有体面的编程语言的包装器。

【讨论】：

为全能的 SVM +1！