总结
贝叶斯算法
- 我们希望模型在分类的时候不是直接返回分类,而是返回属于某个分类的概率
- 特征与特征之间条件独立(特征之间无任何关联),就可以使用贝叶斯算法,朴素指的就是条件独立
- 朴素贝叶斯模型常用于文本分类
在sk-learn中提供了三种不同类型的贝叶斯模型算法
-
高斯模型(基于高斯分布实现分类概率的计算) - 连续型特征:from sklearn.naive_bayes import GaussianNB
- 公式:
- 高斯分布,也就是正态分布,是一种连续型变量的概率分布(高手模型是用来处理连续型特征的)
- 生活中有很多现象或事件发生的概率均服从正态分布
- 高斯分布模型作用:通过训练集样本数据求出它的均值和标准差,有了这个俩个参数就可以估计某个特征属于某个类别的条件概率,以最大化的P为目标,高斯函数会为我们求解公式中的参数
- 公式: