【发布时间】:2017-12-08 15:35:40
【问题描述】:
我想查找用户标签的语义/相似性。
每个用户最多可以使用四个标签。例如,User-1["Machine learning", "Photography", "data science", "neural network"], User-2 ["Machine learning", "Data Science", "Statistics", "Mathematics"], User-2 [“地球物理学”、“机器学习”、“艺术与印刷”、“数学”]。
标签来自广泛的技能。我想找到标签之间的距离/相似度。例如:“机器学习”、“数据科学”和“神经网络”将彼此接近,类似地,“摄影”和“艺术与印刷”将彼此接近。
我正在考虑使用 word2vec。但是我很犹豫在生产中使用它,因为我必须用数千种技能集文档来训练它。不仅如此,在现实生活中,用户总是会更改/更新他们的标签。所以我想建立/开发一个动态算法,将根据用户标签进行调整。
我是机器学习领域的新手。
【问题讨论】:
标签: machine-learning nlp deep-learning word2vec cosine-similarity