【发布时间】:2021-02-18 05:08:37
【问题描述】:
我在 R 中有 2 个带有表观遗传数据的数据框。要将其中一个用作训练集,另一个用作 glmnet 包中的测试集,列号(如果它们必须匹配)。由于两个数据框都包含超过 800000 列,我正在寻找一种方法来比较两个数据框的名称列,以便我可以删除两者没有共同点的列。到目前为止,我刚刚找到了将两个数据帧的行相互比较的包和函数。 例如,我正在寻找这样的东西:
df1
participant_code cg123 cg122 cg121 cg120
df2
participant_code cg123 cg122 cg121 cg119
该功能会给我然后例如一个表格,其中显示了哪些列名不同:
colname 5 differs
如果对我的问题提出任何建议,或者就如何使我的帖子更易于理解提供反馈,我将不胜感激。
【问题讨论】:
标签: r compare glmnet columnname