【发布时间】:2010-11-19 09:18:57
【问题描述】:
你将如何解决以下问题:
我有一个带有文本的半大文件(大约 10 页),我想在该文本中查找重复的内容。具体来说,给定一个字符串,找出最长的两个相同的字符串。
我一直在看最长公共子序列:
http://en.wikibooks.org/wiki/Algorithm_implementation/Strings/Longest_common_subsequence
但是这些实现需要两个字符串作为输入。
也许有服务已经这样做了?
【问题讨论】:
-
您是否只需要“全词”搜索?在这种情况下,将文本拆分为单词并使用 List 或 Dictionary 很简单。