【问题标题】:Algorithms to find the distance/similarity among the user tags?查找用户标签之间距离/相似性的算法?
【发布时间】:2017-12-08 15:35:40
【问题描述】:

我想查找用户标签的语义/相似性。

每个用户最多可以使用四个标签。例如,User-1["Machine learning", "Photography", "data science", "neural network"], User-2 ["Machine learning", "Data Science", "Statistics", "Mathematics"], User-2 [“地球物理学”、“机器学习”、“艺术与印刷”、“数学”]。

标签来自广泛的技能。我想找到标签之间的距离/相似度。例如:“机器学习”、“数据科学”和“神经网络”将彼此接近,类似地,“摄影”和“艺术与印刷”将彼此接近。

我正在考虑使用 word2vec。但是我很犹豫在生产中使用它,因为我必须用数千种技能集文档来训练它。不仅如此,在现实生活中,用户总是会更改/更新他们的标签。所以我想建立/开发一个动态算法,将根据用户标签进行调整。

我是机器学习领域的新手。

【问题讨论】:

    标签: machine-learning nlp deep-learning word2vec cosine-similarity


    【解决方案1】:

    每个标签都可以表示为一个位图(BitSet),一个位代表一个特定的用户是否有这个标签。然后你可以使用一些相似函数,比如 Jaccard 或 Ochiai

    【讨论】:

      猜你喜欢
      • 2015-07-09
      • 2020-08-06
      • 1970-01-01
      • 2013-01-09
      • 1970-01-01
      • 2016-11-13
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多