【发布时间】:2012-03-10 20:37:17
【问题描述】:
我的工作是遗传学,我使用汉明距离(在 Matlab 中)来计算病毒基因型之间的遗传距离。
例如:类型 1 具有结构 01234,类型 2 具有结构 21304 等。显然存在许多基因型。因为基因型的长度相同,所以我认为使用汉明距离就可以了。
我的问题是:如何根据汉明距离对基因型进行排序。另一种说法:如何根据它们之间的汉明距离将基因型分类成簇?
谢谢
【问题讨论】:
标签: hamming-distance
我的工作是遗传学,我使用汉明距离(在 Matlab 中)来计算病毒基因型之间的遗传距离。
例如:类型 1 具有结构 01234,类型 2 具有结构 21304 等。显然存在许多基因型。因为基因型的长度相同,所以我认为使用汉明距离就可以了。
我的问题是:如何根据汉明距离对基因型进行排序。另一种说法:如何根据它们之间的汉明距离将基因型分类成簇?
谢谢
【问题讨论】:
标签: hamming-distance
您可以使用严格的方法对此类数据进行聚类。 根据距离矩阵,您可以使用UPGMA 或neighbor joining
单链接或完全链接也是基于距离的聚类方法。
【讨论】: