【发布时间】:2017-09-11 20:52:54
【问题描述】:
我正在寻求一些关于如何完成以下任务的建议:
我正在分析单细胞 RNAseq 数据集。我在一个表中有我的标准化表达数据(每一列都有一个唯一的单元格 ID,每一行都是一个基因)。
我还有一个注释矩阵,里面有每个单元格的信息(每一行是一个单元格 ID,每一列是一条信息(例如患者 ID、站点等)
对于下游分析,我希望根据注释矩阵中的可用信息进行不同的分组。你们有什么建议我怎么能做到这一点????
比如我有这个
expression_matrix<-matrix(c(1:4), nrow = 4,ncol =4, dimnames = list(c("gene1", "gene2", "gene3", "gene4"),c("cell1","cell2","cell3","cell4")))
annotation_matrix<-matrix(c("1526","1788", "1526","1788","controller","noncontroller","controller","noncontroller","LN","PB","LN","PB"), nrow = 4,ncol =3, dimnames = list(c("cell1","cell2","cell3","cell4"),c("ID","Status","Site")))
我想根据“站点”进行分组,以便我可以将单元格 1 和 3 合并到一个组中,将单元格 2 和单元格 4 合并到另一组中。如何使用将注释矩阵中的信息匹配到 expression_matrix?
比如说,我想在控制器和非控制器之间进行比较,所以我需要以某种方式将 normalized_expression 表中的单元格 ID 与注释矩阵中可用的患者组信息相匹配
【问题讨论】:
-
如果您能提供一个reproducible example,这将很有帮助,其中包含您迄今为止所尝试的数据示例和代码。