【发布时间】:2020-04-03 14:21:18
【问题描述】:
我有一个熊猫数据框,其中第一列包含细菌基因组(名称)。另一方面,我有一本字典,其中的键中有未知的细菌名称,值中有我知道的细菌,这些值在我的数据框中。
我想创建一个新的数据框,其中一列中包含未知名称,然后是第二列中的已知名称以及前一个数据框的某些列。最好看例子。
我的朋友
accession phylum class order genus
1 bacteriaA p__Firmicutes c__Bacilli o__Lactobacillales g__Enterococcus
2 BacteriaB p__Proteobacteria c__Gammaproteobacteria o__Pseudomonadales g__Acinetobacter
我的字典
{'GCF_001999625.1': ['bacteriaA'],
'GCA_000307585.2': ['BacteriaC', 'BacteriaJ', 'BacteriaK'],
'GCA_000404785.1': ['BacteriaB','BacteriaBP']}
我怎么能创造出这样的东西
unknown accession. phylum class order genus
1 GCF_001999625.1 bacteriaA p__Firmicutes c__Bacilli o__Lactobacillales g__Enterococcus
2 GCA_000404785.1 BacteriaB p__Proteobacteria c__Gammaproteobacteria o__Pseudomonadales g__Acinetobacter
基本上,我不走运的是引入查询并以可理解的方式获得 4 列作为输出。
从生物学上讲,我想将我未知的细菌群与我的已知群建立关系。
我已经花了很多时间尝试这个,但我不知道该怎么做。
你能给我一些建议吗?
【问题讨论】:
-
每一种已知细菌都只有一种未知细菌吗?
-
我会说是的