一.简介

DBSCAN算法是一种基于密度的聚类算法。

基于密度的聚类算法会寻找被低密度区域分离的高密度区域。

.

该算法我们首先需要将所有的点分为:核心点,边界点,噪声点。

区分这些点的依据是根据我们提前给出的MinPts和Eps,这里假设我们提前给定MinPts=7
核心点:如果该点的给定邻域内点的个数超过给点的阈值MinPts。下图的点A,以A为圆心,Eps为半径的区域内共有7个点(包括点A和点B一共7个),那么A就是核心点。

边界点:边界点不是核心点,但它落在核心点的邻域内。 下图的点B,以B为圆心,Eps为半径的区域只有4个点,小于MinPts,所以B不是核心点,但由于它落在核心点A的邻域内,所以它是边界点。

噪声点:噪声点是除了核心点和边界点之外的点。如点C,以C为圆心,Eps为半径的区域内只有3个点,所以它不是核心点,并且它不在A的邻域内,所以它不是边界点。所以它为噪声点。
聚类分析(三)——DBSCAN算法

二.DBSCAN算法

1.将所有的点标记为核心点、边界点、噪声点
2.删除噪声点
3.为距离在Eps之内的所有核心点直接赋予一条边
4.每组连通的核心点形成一个簇
5.将每个边界点指派到一个与之关联的核心点所在的簇中

参考书籍:
《数据挖掘导论》由人民邮电出版社出版,[美]作者Pang-Ning Tan,Michael Steinbach,Vipin Kumar 合著

相关文章:

  • 2021-11-01
  • 2021-08-13
  • 2021-11-22
  • 2021-11-02
猜你喜欢
  • 2021-12-17
  • 2021-05-09
  • 2021-10-15
  • 2021-05-12
  • 2021-11-24
相关资源
相似解决方案