【发布时间】:2021-07-25 13:27:15
【问题描述】:
我有一个包含数千行的数据集。每行是一个人,我需要将其插入 4 个集群。我知道有很多方法可以做到这一点并找到最好的集群,但在这种情况下,我知道每个集群的特征。通常,使用 ML,使用 IA 找到集群。
例如,假设我有 4 列要查看:money_spending、salary、segment、days_to_buy。另外,我有:
集群 1 -> money_spending:350-700
工资:700-1000
细分市场:农场
days_to_buy: 12
第 2 组 -> money_spending:500-950
工资:1000-1300
细分:建筑材料
days_to_buy: 18
第 3 组 -> money_spending:900-1400
工资:1200-2000
细分市场:超市
days_to_buy: 20
第 4 组 -> money_spending:250-600
工资:550-1000
细分市场:农场
days_to_buy: 30
将此应用于我的数据集的最佳方法是什么?我会使用 k-nearest,但我不知道如何使用我的集群信息。
有人可以帮我吗?
另外:如果我有更多列或更多集群,解决方案是否仍然有效?
编辑:我的原始数据集只有列。集群知道,但不在数据集中。工作就是将此集群信息准确地应用于数据集。我不知道该怎么做。
【问题讨论】:
标签: python machine-learning jupyter-notebook artificial-intelligence cluster-analysis