【问题标题】:Finding similarity between two user profiles查找两个用户配置文件之间的相似性
【发布时间】:2015-08-12 16:43:34
【问题描述】:

我有具有以下属性的用户配置文件。 U={年龄、性别、国家、种族} 找到两个用户之间相似性的最佳方法是什么? 例如,我有以下 2 个用户。 u1={25,M,美国,白色} u2={30,M,UK,黑色}

我搜索并发现余弦相似度被提及很多。对我的问题或任何其他建议有好处吗?

【问题讨论】:

  • 是的,您可以尝试不同的相似性度量。皮尔逊相似度也被大量使用。但是您可能需要注意分类变量国家和种族。

标签: machine-learning recommendation-engine user-profile cosine-similarity


【解决方案1】:

聚类分析中对象之间的相似性度量是一个广泛的主题。

我建议您考虑“分而治之”的方法。将两个用户配置文件之间的相似度视为所有属性相似度的加权平均值。只需记住在执行 avg 之前为您的属性相似性用户归一化值。应根据数据和用例确定平均值的权重。如果您认为其中一个维度在两个配置文件之间匹配时更为重要,则它在整体结果中应该具有更大的权重。

对于属性距离可以试试:age -> simple Euclidian;性别、种族、国家 -> 0/1。如果您有时间,可以根据 geoloc 更好地定义两个国家之间的距离。或文化相似性(例如语言、宗教、政治制度、GDP 等)。但可能对最终平均值的权重进行实验,并且您的聚类结果分析会给您带来更多回报;-)

【讨论】:

  • 您对属性的建议,我正在尝试匹配两个患者来推荐医生或医院
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2011-09-09
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2016-09-01
  • 2019-01-26
相关资源
最近更新 更多