【发布时间】:2021-01-31 21:08:12
【问题描述】:
我的数据框中有一些字符串(女性 x 男性、地区等),我想拟合决策树。因此,我在所有这些分类特征中应用了一个热编码器——它返回了一堆包含 0 和 1 的新列。
但是,决策树中特征阈值的默认值为 0.5。这对这些分类列没有意义。
有人知道我如何在 python 中一次更改大量列的阈值(无需输入每列的名称)吗?
我想要类似:女性列分为 0 和 1。我想在计算统计数据(AUC、ROC、ACC 等)之前完成所有这些操作。
ps:我还有一些数值数据(例如收入),所以我无法更改所有列的阈值 ps2: 分类 1 和 0 在第 6 到 30 列。
【问题讨论】:
标签: python python-3.x data-science decision-tree