【发布时间】:2020-11-17 19:21:02
【问题描述】:
我有一个相关数据框:
import pandas as pd
dt = pd.DataFrame({'var1': np.random.randn(3 * 50),
'var2': np.random.randn(3 * 50),
'var3': np.random.randn(3 * 50),
'var4': np.random.randn(3 * 50),
'var5': np.random.randn(3 * 50)})
dt_corr = dt.corr()
我想创建一个列表,其中将包含vars,其中:
- 这对的两个
vars,对于相关性小于阈值(绝对值)的对 - 对于具有较高相关性(绝对值)的对,只保留两个
vars 之一。
我该怎么做?
【问题讨论】:
标签: python python-3.x pandas