【问题标题】:PHP duplicate content detection system [closed]PHP重复内容检测系统[关闭]
【发布时间】:2023-03-28 08:25:02
【问题描述】:

是否有任何流行的PHP 库或服务可以帮助检测重复内容?

我运行的网站包含用户生成的内容,并且我想检测相似或重复的内容。是否有任何流行的图书馆可以帮助解决这个问题?

【问题讨论】:

  • 要求我们推荐或查找工具、库或喜爱的场外资源的问题对于 Stack Overflow 来说是题外话,因为它们往往会吸引固执己见的答案和垃圾邮件。相反,describe the problem 以及迄今为止为解决它所做的工作。

标签: php


【解决方案1】:

文本相似性/抄袭/重复是一个很大的话题。有很多算法和解决方案。

一些项目使用“关键字的自适应本地对齐”(您可以在 google 上找到相关信息。)

另外,您可以检查一下(检查答案中的3个链接,非常有启发性):

Cosine similarity vs Hamming distance

希望这会有所帮助。

【讨论】:

  • 非常有用的链接谢谢!
  • 不客气,如果可以,请接受答案;)
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2010-12-30
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2014-04-14
  • 1970-01-01
相关资源
最近更新 更多