给定已知处理的聚类策略答案

【问题标题】：Clustering strategy given a known treatment给定已知处理的聚类策略
【发布时间】：2016-04-22 11:04:57
【问题描述】：

是否有策略在一个条件下对一个组内的共享属性进行聚类，知道该条件应该会激发两个组之间的差异？

一个具体的例子：假设 A 组有 4 个人，B 组也有 4 个人。A 组被引入 StackOverflow，其他人只剩下他们的钢铁意志。为每个人检查了 30 000 个基因。我们预计 A 组个体与 B 组相比应该相对无压力。因此，我们寻找可能在 B 组中高表达但在 A 组中低表达的基因簇。识别这组基因很有用，因为这些基因可以解释对压力的生物学反应。

但事实证明，这两组不是线性可分的——PCA 在 A 组和 B 组中显示出很大的差异。A 组中的一些个体与 B 组聚类。有些基因在组中被上调B，但 A 组中的一两个人也承受这种上调。是否有一种策略可以找到属性由 A 组中的所有个体一致共享的集群，并且该集群不同于 B 组中的所有个体，知道这两个组应该是不同。

【问题讨论】：

标签： r classification cluster-analysis data-analysis pheatmap

【解决方案1】：

这不是聚类分析。

你有两个类：治疗和控制

并且您想识别有助于区分这两个类别的特征（基因）。

寻找有监督的特征选择方法，例如信息增益；并研究可解释的分类器，例如决策树和随机森林，它们将帮助您识别最具辨别力的基因。

【讨论】：

你能推荐更多可以使用的详细地块吗？谢谢