KMeans-demo

KMeans-demo

数据准备
KMeans聚类
可视化绘图

KMeans-demo

数据准备

# -*-coding:utf-8-*-
from sklearn.cluster import KMeans

"""
数据集
X表示二维矩阵数据，篮球运动员比赛数据
总共20行，每行两列数据
第一列表示球员每分钟助攻数：assists_per_minute
第二列表示球员每分钟得分数：points_per_minute
"""

X = [[0.0888, 0.5885],
     [0.1399, 0.8291],
     [0.0747, 0.4974],
     [0.0983, 0.5772],
     [0.1276, 0.5703],
     [0.1671, 0.5835],
     [0.1906, 0.5276],
     [0.1061, 0.5523],
     [0.2446, 0.4007],
     [0.1670, 0.4770],
     [0.2485, 0.4313],
     [0.1227, 0.4909],
     [0.1240, 0.5668],
     [0.1461, 0.5113],
     [0.2315, 0.3788],
     [0.0494, 0.5590],
     [0.1107, 0.4799],
     [0.2521, 0.5735],
     [0.1007, 0.6318],
     [0.1067, 0.4326],
     [0.1956, 0.4280]
     ]

KMeans聚类

"""
KMeans聚类
"""

clf = KMeans(n_clusters=3)  # 聚类算法，参数n_clusters=3，聚成3类
y_pred = clf.fit_predict(X)  # 直接对数据进行聚类，聚类不需要进行预测

# 输出聚类预测结果，20行数据，每个y_pred对应X一行或一个球员，聚成3类，类标为0、1、2
print (y_pred)

可视化绘图

"""
可视化绘图
Python导入Matplotlib包，专门用于绘图
"""

import matplotlib.pyplot as plt
import matplotlib.font_manager as fm 
# 引入中文字体
myfont = fm.FontProperties(fname=r'simkai.ttf') 

# 获取第一列和第二列数据 使用for循环获取 n[0]表示X第一列
x = [n[0] for n in X]
print (x)
y = [n[1] for n in X]
print (y)

plt.figure(figsize=(10,5)) 

# 绘制散点图 参数：x横轴 y纵轴 c=y_pred聚类预测结果 marker类型 o表示圆点 *表示星型 x表示点
plt.scatter(x, y, c=y_pred, marker='x')

# 绘制标题
plt.title("Kmeans-篮球数据",fontproperties=myfont,fontsize=18)

# 绘制x轴和y轴坐标
plt.xlabel("每分钟助攻数",fontproperties=myfont,fontsize=18)
plt.ylabel("每分钟得分数",fontproperties=myfont,fontsize=18)

# 显示图形
plt.show()

KMeans-demo

当前笔记参考课程从零开始学习机器学习**** 在此鸣谢。