应用
机器学习课程笔记---聚类
评价指标
机器学习课程笔记---聚类
机器学习课程笔记---聚类
距离
机器学习课程笔记---聚类

k-means算法

前提要选取k个点
机器学习课程笔记---聚类
重心点不变了就可以。

存在的问题

1、初始点
2、k,从1开始试,慢慢增加,看趋势
机器学习课程笔记---聚类

聚类之前需要做的事
!!!一定要归一化,不同维度的值统一到一个范围中。
机器学习课程笔记---聚类
以及均值中心化。

2、k-means++

机器学习课程笔记---聚类
这里的概率就是用轮盘赌算法

机器学习课程笔记---聚类

对于数值型的,可以算距离;对于离散的属性,怎么算距离?

K-prototype

机器学习课程笔记---聚类
为了防止分类距离对整体距离的影响
机器学习课程笔记---聚类
还与分类属性的取值频度也有关系,比如某个属性上样本之间取值都一样,但是并不代表没有距离。

快速峰值密度搜索聚类

假设
机器学习课程笔记---聚类

每个点画个圈,数点表示密度;
离另一个密度大的点的距离
B图是决策图
聚类中心点自动剔除,以及删除异常点。

快,体现在只算一次。
机器学习课程笔记---聚类

相关文章:

  • 2021-06-19
  • 2021-12-12
  • 2022-02-08
  • 2021-09-02
  • 2021-07-12
  • 2021-05-04
  • 2021-10-08
猜你喜欢
  • 2021-08-02
  • 2021-05-07
  • 2022-03-07
  • 2021-05-27
  • 2022-01-07
  • 2021-11-21
  • 2021-12-28
相关资源
相似解决方案