【发布时间】:2021-05-04 18:36:41
【问题描述】:
我希望你有一个愉快的一天。我的数据库中有用户,在这个数据库中,用户具有可能与其他用户相似的功能。例如:
user1 has a,b,c,d,g feature
user2 has a,b,c,e feature
user3 has b,c,f feature
user4 has c feature
...
我想编写一个算法,将用户分成 4 个组,组内的那些应该是具有相似功能的最优化的,如何使用 kmeans 呢?还是我需要使用其他算法,有什么想法吗?
【问题讨论】:
-
究竟什么是“功能”? - 注意缩放,比如如果 a,b,c...f 是 1,0,并且特征是 CM 中的长度,它几乎会忽略特征。
-
功能是用户阅读的书籍@user3184950