非监督学习的特点?
物以类聚,人以群分
非监督学习(unsupervised learning)的方法主要有 K - means
k-means步骤
1、k-means API
• sklearn.cluster.KMeans
2、Kmeans性能评估指标
b_i>>a_i: 趋近于1 效果最好
b_i<<a_i:趋近于 趋近于-1,效果不好 ,效果不好
轮廓系数的值是介于 [-1,1] ,越趋近于1代表内聚度和分离度都相对较优
3、Kmeans性能评估指标API
• sklearn.metrics.silhouette_score
sklearn.metrics.silhouette_score(X, labels)
• 计算所有样本的平均轮廓系数
• X:特征值
• labels:被聚类标记的目标值