【发布时间】:2021-08-20 01:55:18
【问题描述】:
我有一个代表 Pearson 相关性结果的数据框。这是一个结构示例:
Row | Column | cor
Event |Event | 1
mean |Event | .82
mean |kurtosis| .30
mean |entropy | .85
entropy |Event | .71
entropy |kurtois | .25
kurtosis|Event | .69
我需要过滤相关性,因此如果两个特征之间的相关性大于 0.80(条件 1)阈值,则仅选择与“事件”关联度最高的变量(条件 2)。 我希望最终产品看起来像这样:
Row | Column | cor
mean |Event | .82
在上面的示例中,均值和熵在阈值之上是相关的,但是,“均值”与“事件”具有更高的相关性,因此这是最终的输出。我正在使用生物数据,所以我有 100 多个特征,手动操作太多了。
【问题讨论】:
-
如果
cor(kurtosis, Event)是 0.87 你会得到什么行?
标签: r filter conditional-statements sequential