【问题标题】:From regression to classification : transform floats to categories [closed]从回归到分类:将浮点数转换为类别 [关闭]
【发布时间】:2021-08-01 01:15:23
【问题描述】:

我有一个包含人员年龄列表的数组: [41, 50, 12, ... , 94]

我想将它们映射到20 类别。有没有办法自动检测列表中的最佳类别(例如[15,20,22,24,28,.., 90]?),然后在其上映射现有数组。

【问题讨论】:

  • “最佳”完全是主观的。根据您的研究,您尝试过什么?如果您手动操作,将如何拆分数字?四分位数、标准差、聚类算法等

标签: python arrays pandas machine-learning categorical-data


【解决方案1】:

您可以使用 pandas cut 功能,它将年龄映射到正确的 bin:

import pandas as pd
ages = [41, 50, 12, 78,43, 94]
bin_edges = [0,10,15,20,30,50,70,100]
pd.cut(ages,bin_edges)

【讨论】:

  • 要完整,我必须得到bins,然后用lambda函数lambda x : (bins[x] + bins[x+1])/2转换每个年龄
猜你喜欢
  • 2021-10-24
  • 1970-01-01
  • 2017-04-30
  • 1970-01-01
  • 2013-07-01
  • 2021-05-15
  • 1970-01-01
  • 2016-10-01
  • 1970-01-01
相关资源
最近更新 更多