【发布时间】:2021-06-24 11:57:26
【问题描述】:
我有一个这样的数据框:
| Family | Genus | Species |
|---|---|---|
| Gemmatimonadaceae | Roseisolibacter | Roseisolibacter_agri |
| Bacillaceae | Bacillus | NA |
| Blastocatellaceae | NA | NA |
我想修改如下:
| Family | Genus | Species |
|---|---|---|
| Gemmatimonadaceae | Roseisolibacter | Roseisolibacter_agri |
| Bacillaceae | Bacillus | Unclassified Bacillus |
| Blastocatellaceae | Unclassified Blastocallaceae | Unclassified Blastocallaceae |
我试图这样做:
replace_na(
list(Genus = paste("Unclassified", Family),
Species = paste("Unclassified", Genus)))
或使用
replace_na(
list(Genus = paste("Unclassified", vars(Family)),
Species = paste("Unclassified", vars(Genus))))
但在这两种情况下,我最终都会得到“未分类的属”或“未分类的~属”。
我怎样才能让它从以前的已知变量继承?
我也想过使用fill(),但它只适用于整洁的数据。当然,我可以转置 data.frame,但必须有一个更优雅/简单的解决方案!
【问题讨论】:
-
“我可以转置data.frame,但必须有一个更优雅/简单的解决方案!”:有人会说整洁的解决方案是优雅的解决方案! ;=) 但是在这里,因为您使用的是同一行中的数据,所以我认为您当前的格式是可以使用的。
-
我想让它整洁,但我用于分析的主要包是 phyloseq,这个数据框是按行导入的:|
-
taxonomyTable-class {phyloseq} R 文档 将分类数据作为字符矩阵保存的 S4 类。描述 行索引代表分类群,列代表分类分类器。
-
啊,我们经常被别人的短视所束缚!
-
我确定这是最近提出的问题的重复
标签: r dataframe dplyr data-wrangling