【发布时间】:2021-07-28 21:45:18
【问题描述】:
我有一个表格,每个 hpo_term 一行,因此单个患者的每个 ID 可以有很多行。
ID hpo_term
123 kidney failure
123 hand tremor
123 kidney transplant
432 hypertension
432 exotropia
432 scissor gait
我还有另外两张表,一张是肾脏术语,另一张是非肾脏术语,肾脏一个看起来像这样:
kidney failure
kidney transplant
hypertension
非肾的长这样:
hand tremor
exotropia
scissor gait
我想要的结果是这样的表格:
ID kidney_hpo_term non_kidney_hpo_term
123 kidney failure;kidney transplant hand tremor
432 hypertension exotropia;scissor gait
实际上有数百名患者和数百个 HPO 术语。
我可以访问基础 R; dplyr,但我真的不知道如何解决这个问题。
非常感谢您的帮助。
非常感谢
编辑:
真正的 table1 有更多不相关的额外列,并且每个 ID 始终相同,我也想导入它。例如:
ID hpo_term year_of_birth affected_relative genome
123 kidney failure 2000 Y 38
123 hand tremor 2000 Y 38
123 kidney transplant 2000 Y 38
432 hypertension 1980 N 37
432 exotropia 1980 N 37
432 scissor gait 1980 N 37
【问题讨论】:
-
可以
dput(data)方便测试吗?
标签: r merge data.table lookup