【问题标题】:LSA - steps after finding the SVDLSA - 找到 SVD 后的步骤
【发布时间】:2012-01-19 07:28:17
【问题描述】:

从早上开始,我已经阅读了很多教程。我的问题涉及找到两个文档之间的相似性。为此,我期待在 java 中使用 LSA。

我了解了术语文档矩阵的创建,然后将 SVD(维数减少)应用于它。结果获得了 3 个矩阵。这听起来可能很愚蠢,但我已经坚持了很长一段时间。现在,如果我必须找到两个文档之间的相似性,我该怎么办?

【问题讨论】:

  • 因为我只比较两个文档,使用 LSA 是否有利?

标签: java similarity svd latent-semantic-indexing


【解决方案1】:

使用 SVD 计算出 3 个矩阵后,需要计算要比较的两个文档的向量之间的相关性。你可以使用斯皮尔曼的相关性。 另一种方法是使用余弦距离。

你会在LSA找到更多细节,有一个完整的例子和解释。

您可能会搜索一些用于 LSA 的 java 库。

【讨论】:

猜你喜欢
  • 2013-06-05
  • 2011-12-10
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2015-04-12
  • 2020-12-12
  • 2013-01-19
相关资源
最近更新 更多