Bagging
-
概念
Bagging算法 (英语:Bootstrap aggregating,引导聚集算法),又称装袋算法,是一种重要的集成学习方法。最初由Leo Breiman于1996年提出。 -
用途
Bagging算法可用于分类、回归。 -
优点
提高其准确率、稳定性的同时,通过降低结果的方差,避免过拟合的发生。
减少噪音的影响,体现样本真实的分布情况,见下图: -
工作机理
通过多次多轮的sampling with replacement,构建多个分类器或回归,最终的预测结果为样本在这多个学习器上的结果平均值(投票少数服从多数),运行过程见下图: -
并行性
由于各学习器之间是独立存在,因此,可并行处理。