【发布时间】:2015-11-13 22:45:59
【问题描述】:
我有一组 500 个细胞和另一组大约 12 个基因。我还有一本字典,其中包含细胞映射到基因,以及基因映射到计数。我想将此信息构造成一个矩阵,其中我们将单元格作为列名,将基因作为行名。每个基因细胞将包含计数。如果该特定单元格没有计数,则用零占位符填充它
这是一个玩具示例。假设你得到了这些数据:
cells = set(['cell_1', 'cell_2'])
genes = set(['gene_a', 'gene_b', 'gene_c', 'gene_d', 'gene_e', 'gene_f'])
test_data = {'cell_2': {'gene_c': 13, 'gene_f': 6},
'cell_1': {'gene_a': 12, 'gene_c': 2}}
我们想像这样创建一个制表符分隔的表格:
cell_1| cell_2
-------|------|-------
gene_a | 12 | 0
gene_b | 0 | 0
gene_c | 2 | 13
gene_d | 0 | 0
gene_e | 0 | 0
gene_f | 0 | 6
这里的最终目标是以制表符分隔的格式写出这个矩阵。任何帮助将不胜感激。
【问题讨论】:
标签: python dictionary matrix