【发布时间】:2020-10-05 06:30:22
【问题描述】:
我已经阅读了类似的问题,但我的问题略有不同。我有一个数据框 (df1),其中包含超过 300 万行、1874 个物种(科学名称)和总值。
我还有另一个数据框 (df2),它提供了我想为每个物种保留的行数(总共大约 200 万行)。
我想做的是根据 df2 中指定的行数对 df1 进行子集/过滤,只保留总值最高的那些行。例如。假设 df2 n.at.70 = 1104(而不是 1)中的 Cypraeidae,所以我希望得到的 df 保留 1104 行,从最高总值到该物种的第 1104 最高总值(科学名称)。
我无法为一个物种实现这一点,更不用说想出一个有效的“应用”或“for”循环,所以任何帮助都将不胜感激,我对 R 比较陌生。
【问题讨论】:
-
See here 关于制作一个更易于人们帮助的可重现示例,包括一个可行的数据样本,而不是图片。目前尚不清楚您要做什么,主要是因为您包含的 2 张数据图片似乎没有重现问题
标签: r filter dplyr group-by subset