【发布时间】:2017-02-20 18:56:48
【问题描述】:
我有 50 x 50 矩阵中的数据,代表 50 种期刊及其相关性。现在,我正在尝试根据数据绘制图表,显示这 50 种期刊属于哪些集群。
1) 我更喜欢使用完全链接或沃德的方法来做集群。 2)我被困在从哪里开始聚类,因为 scikit-learn 中的文档对我来说太技术性了 3)你能帮我启动一下吗?
提前非常感谢您...
我的所有数据都在 -1 和 1 之间,因为它是相关系数。
数据样本示例(50*50):
数据 = [[ 1. 0.49319094 0.58838586 ..., 0.11433441 0.6450184 0.60842821]
[ 0.49319094 1. 0.39311674 ..., -0.00795401 0.42944597 0.68855177]
[ 0.58838586 0.39311674 1. ..., 0.39785574 0.864322 0.68910632]
...,
[ 0.11433441 -0.00795401 0.39785574 ..., 1. 0.38623474 0.34228516]
[ 0.6450184 0.42944597 0.864322 ..., 0.38623474 1. 0.65408474]
[ 0.60842821 0.68855177 0.68910632 ..., 0.34228516 0.65408474 1. ]]
【问题讨论】:
标签: python scikit-learn cluster-analysis correlation hierarchical-clustering