【发布时间】:2022-07-27 22:21:10
【问题描述】:
使用 R.Studio 我有一张来自数百个样本的 DNA 大小分布图的原始数据表。 对于每个具有相同大小(x 值)的样本,RFU(y 值)按列排列在单独的列中 - 见下文。
Size distribution graph example for visualisation
示例数据:(组成值只是为了显示表格的格式)
| sample001_rfu | sample002_rfu | sample003_rfu | size_bp |
|---|---|---|---|
| 5678 | 4567 | 3456 | 1000 |
| 8901 | 7890 | 6789 | 5000 |
| 10234 | 10123 | 10010 | 10000 |
| 12356 | 12345 | 11234 | 15000 |
| 15678 | 14567 | 13445 | 20000 |
| 13890 | 16589 | 15624 | 25000 |
| 10987 | 13425 | 17245 | 30000 |
| 8902 | 11323 | 15428 | 35000 |
| 6513 | 8919 | 12879 | 40000 |
| 4178 | 6528 | 10256 | 45000 |
| 3213 | 4380 | 8621 | 50000 |
我正在尝试找到所有样本的最大 y 值 (RFU)(即每列中的最大值)并报告相应的 x 值(大小)将用于下游自动化样品处理计划。
所以,在上表中:
- sample001 = 20000bp(最大 rfu = 15678)
- sample002 = 25000bp(最大 rfu = 16589)
- sample003 = 30000bp(最大 rfu = 17245)
我对一个样本使用了以下方法:
df$size_bp[which.max(df$sample001_rfu)]
但是,如果不手动替换上面代码中的示例 ID,我似乎无法找到一个解决方案来为表中的每个 sample_rfu(列)重复此操作。 然后,我想将这些值及其样本 ID(列标题)存储为一个列表,稍后将与不同的处理阈值进行比较。
任何建议将不胜感激!
【问题讨论】: