【发布时间】:2021-10-29 07:18:36
【问题描述】:
我有以下数据集,其中 subj_id 代表参与者,trial_type 代表它是练习试验还是实际实验试验(即测试),我的因变量表示为 DV。
我需要编写一个 if 语句,其中我只想包含练习 3 DV 大于练习 4 DV 的参与者(即 subj_id)。因此,添加另一列,例如“包含”,其中参与者 1 的值应为 1,表示它们应保留在进一步处理中,参与者 2 的值应为 0,表示不应保留它们。
我知道如何对 trial_type > 60 等内容进行子集化,但我不知道如何使用 if 语句对列中的值进行子集化。
| subj_id | trial_type | DV |
|---|---|---|
| 1 | Practice1 | 67 |
| 1 | Practice2 | 3 |
| 1 | Practice3 | 78 |
| 1 | Practice4 | 14 |
| 1 | Test | 97 |
| 1 | Test | 65 |
| 1 | Test | 28 |
| 1 | Test | 16 |
| 1 | Test | 97 |
| 1 | Test | 35 |
| 2 | Practice1 | 100 |
| 2 | Practice2 | 99 |
| 2 | Practice3 | 99 |
| 2 | Practice4 | 100 |
| 2 | Test | 29 |
| 2 | Test | 18 |
| 2 | Test | 33 |
| 2 | Test | 46 |
| 2 | Test | 87 |
| 2 | Test | 95 |
【问题讨论】:
标签: r dplyr tidyverse data-transform