【发布时间】:2011-09-14 06:29:06
【问题描述】:
我想知道我可以做实验的算法列表,以根据一组输入预测患者患癌症或发烧或其他疾病的概率...请假设我有数百万的数据,所以我想尝试预测的最佳算法...我对数据挖掘和机器学习真的很陌生....
【问题讨论】:
-
我对算法一无所知,但可能知道的人需要更多信息。例如输入示例等?也许描述一个测试用例?
标签: machine-learning data-mining prediction
我想知道我可以做实验的算法列表,以根据一组输入预测患者患癌症或发烧或其他疾病的概率...请假设我有数百万的数据,所以我想尝试预测的最佳算法...我对数据挖掘和机器学习真的很陌生....
【问题讨论】:
标签: machine-learning data-mining prediction
目前最流行的预测和分类算法之一是 Leo Breiman 的Random Forests (RF)。它的实现也可以在 weka 中使用。
【讨论】:
如果您专门研究估计某事的概率,那么您需要使用生成概率的机器学习方法。大多数只生成一个类标签:是/否。
最知名的概率估计算法是逻辑回归。 Weka 中提供了一个实现。
【讨论】:
使用大量机器学习库开始实验的最流行工具是Weka。在这里,您可以上传您的数据并尝试多种算法。它的弱点是可扩展性,但处理数据不是问题。
【讨论】: