【发布时间】:2019-12-19 17:47:21
【问题描述】:
我对我的数据运行了 XGBoost 算法,发现有 15 个特征很重要。我重命名了我的数据框中的列,然后再次运行相同的 XGBoost 算法并注意到我的重要特征发生了变化。矩阵中的顺序略有混乱,并且存在 2-3 个新变量。基本相同,但考虑到我只更改了 col 名称,我想知道是什么导致了功能重要性的这种变化。我使用树形来查找特征重要性,下面是我如何重命名列。
colnames = pd.read_csv("kbmg_colnames.csv")
d = dict(zip(colnames['Actual'], colnames['To be changed']))
Data_test = Data_test.rename(columns=d)
【问题讨论】:
-
你设置的是固定的
random_state吗? -
是的,我正在设置一个随机状态。我正在通过完全相同的代码运行 2 个数据帧(在列更改之后和之前)。
标签: python machine-learning data-science