【发布时间】:2013-03-26 23:50:33
【问题描述】:
我正在尝试理解由 scikit (http://scikit-learn.org/0.13/auto_examples/cluster/plot_dbscan.html) 实现的 DBSCAN 算法的示例。
我换行了
X, labels_true = make_blobs(n_samples=750, centers=centers, cluster_std=0.4)
X = my_own_data,所以我可以将自己的数据用于 DBSCAN。
现在,make_blobs 的第二个返回参数变量labels_true 用于计算结果的一些值,如下所示:
print "Homogeneity: %0.3f" % metrics.homogeneity_score(labels_true, labels)
print "Completeness: %0.3f" % metrics.completeness_score(labels_true, labels)
print "V-measure: %0.3f" % metrics.v_measure_score(labels_true, labels)
print "Adjusted Rand Index: %0.3f" % \
metrics.adjusted_rand_score(labels_true, labels)
print "Adjusted Mutual Information: %0.3f" % \
metrics.adjusted_mutual_info_score(labels_true, labels)
print ("Silhouette Coefficient: %0.3f" %
metrics.silhouette_score(D, labels, metric='precomputed'))
如何从我的数据 X 计算 labels_true?在这种情况下,scikit 与label 到底是什么意思?
感谢您的帮助!
【问题讨论】:
标签: python scikit-learn dbscan