【发布时间】:2017-04-19 20:52:01
【问题描述】:
在所有记录中,我在名为 test3333 的数据框中有两列(parent_mol_chembl_id,parent_name)的 225 条重复记录(2859 条观测值,4734 列)。
parent_mol_chembl_id parent_name D000022 D000038 D000152 D000166
CHEMBL1502 PANTOPRAZOLE 0 0 0 0
CHEMBL1502 PANTOPRAZOLE 0 0 0 1
CHEMBL790 DZOLE 0 0 1 1
CHEMBL790 DZOLE 0 0 0 1
我想找出重复行中哪些列不同。
我这样做grep('CHEMBL1502', test3333[,1]) 然后我检查不同的列范围以识别差异。
grep('CHEMBL1502', test3333[,1])的期望输出
parent_mol_chembl_id parent_name D000166
CHEMBL1502 PANTOPRAZOLE 0
CHEMBL1502 PANTOPRAZOLE 1
grep('CHEMBL790', test3333[,1])的期望输出
parent_mol_chembl_id parent_name D000152
CHEMBL790 DZOLE 1
CHEMBL790 DZOLE 0
我想找出特定 parent_mol_chembl_id 的数据框中哪些列名不同?请让我知道检查不同列的语法是什么?
【问题讨论】:
标签: r