【发布时间】:2020-07-28 14:46:27
【问题描述】:
我有一个数据框,其中一列中包含多个物种,另一列中包含程序集的名称。每个物种都有不同数量的组件;
especies1 --- assembly1
especies1 --- assembly2
especies1 --- assembly3
especies1 --- assemblyN
especies2 --- assembly1
especies2 --- assembly2
especies2 --- assemblyN
问题是每个物种都有不同的大量装配(1000-100000 个装配),所以我想生成一个 df,每个物种随机选择 150 个装配。
这样,每个物种的组件数量完全相同。
我真的被阻止了,
我会很感激任何建议! 问候!
【问题讨论】: