【发布时间】:2021-08-19 15:22:48
【问题描述】:
我在 R 中有两个数据表;表 1 较小,大约有 4,000 行和 4 列。这些列是 ID、Report_Date、Start_date 和 End_date。另一个表,表 2,是一个更大的表,有数千行和 8 列。两个表都有 ID col,但这个 ID col 在两个表中可以有多个行。表 2 中还有一个日期列和一个名为“值”的列。表 2 中的其余列不适用于此任务。
对于表1中的每一行,我需要根据2个条件计算表2中col“Value”的标准偏差; 1. ID 必须匹配,2. 日期范围在表 1 中的 Start_Date 和 End_Date 定义的间隔内。如何在 R 中做到这一点?我附上了下面两张表的小样本。在下面的示例中,我需要 Start_Date 和 End_Date 中日期范围的 A1 值的标准差,因此 STD_Value(A1, report date of 2008/10/02)= sd(10,11,11)。
示例表 1 如下所示:
| ID | Report_Date | Start_Date | End_Date |
|---|---|---|---|
| A1 | 2008/10/02 | 2008/09/27 | 2008/09/30 |
| A1 | 2008/11/02 | 2008/10/27 | 2008/10/30 |
| A2 | 2008/02/02 | 2008/01/15 | 2008/01/17 |
示例表 2 如下所示:
| ID | Date | Value |
|---|---|---|
| A1 | 2008/09/27 | 10 |
| A1 | 2008/09/28 | 11 |
| A1 | 2008/09/30 | 11 |
| A1 | 2008/10/01 | 12 |
| A1 | 2008/10/02 | 13 |
| A2 | 2008/01/14 | 5 |
| A2 | 2008/01/15 | 4 |
| A2 | 2008/01/16 | 3 |
| A2 | 2008/01/17 | 5 |
| A2 | 2008/01/18 | 5 |
【问题讨论】:
标签: r conditional-statements standard-deviation