【发布时间】:2016-10-20 16:24:07
【问题描述】:
我有两个部分看起来像这样的数据框:
d1
SRR1686681 SRR1686679 SRR1686680 SRR1686686 ERR1014349 ERR1014347
FJ889562.1.1501 0 0 0 0 0 0
JQ236848.1.1432 1 0 1 0 0 0
EU431805.1.1493 0 0 0 0 0 0
EU537467.1.1392 1 0 0 0 10 0
JF500179.1.1495 0 0 0 0 0 0
HM128723.1.1454 0 0 0 0 0 0
和d2
taxonomy X X.1 X.2 X.3 X.4 X.5
FJ889562.1.1501 Bacteria Proteobacteria Alphaproteobacteria Rhizobiales Rhodobiaceae Parvibaculum uncultured bacterium
JQ236848.1.1432 Bacteria Proteobacteria Betaproteobacteria Burkholderiales Comamonadaceae Variovorax uncultured bacterium
EU431805.1.1493 Bacteria Proteobacteria Alphaproteobacteria Rhizobiales Rhizobiaceae Rhizobium Agrobacterium sp. BKBLPu14
EU537467.1.1392 Bacteria Proteobacteria Betaproteobacteria Rhodocyclales Rhodocyclaceae Azoarcus bacterium SL4.29
JF500179.1.1495 Bacteria Proteobacteria Alphaproteobacteria Sphingomonadales Sphingomonadaceae Novosphingobium uncultured alpha proteobacterium
HM128723.1.1454 Bacteria Proteobacteria Betaproteobacteria Burkholderiales Comamonadaceae Variovorax Variovorax sp. SOD31
我想将 d1 中匹配的行名替换为 2 中相应的合并行。
例如如果在d2发现FJ889562.1.1501,则在d1替换为“Bacteria, Proteobacteria, Alphaproteobacteria, Rhizobiales, Rhodobiaceae, Parvibaculum, uncultured bacterium”。
这太混乱了吗?
感谢您的帮助。
【问题讨论】:
-
如果您使用
dput()会有所帮助,以便我们可以使用您的数据测试一些解决方案。澄清一下,您希望 d1 中的第一个 行名称 显示为“Bacteria, Proteobacteria, Alphaproteobacteria, Rhizobiales, Rhodobiaceae, Parvibaculum, uncultured bacterium”? -
请问您为什么要这样做?完全按照您的意愿行事会导致数据混乱,难以分析...