从大型数据集中找到相似数据模式的有效方法答案

【问题标题】：Effective way to find similar data pattern from a large data set从大型数据集中找到相似数据模式的有效方法
【发布时间】：2014-08-04 01:28:01
【问题描述】：

我在数据库中有一个大型数据集（数百万条记录），一个简化的示例如下： 6,1,3,5,2,3,4,5,6,7,9,3,1,3,5,4,6,3,4,6,4,5,7,4,5,0,8,... (millions records) 这里每个数字代表一行的一个键值。

我需要找到所有出现的1,3,5。直接的方法是迭代整个数据集并在每次迭代中检查三个连续的行。

有没有更有效的算法来做到这一点？

【问题讨论】：

【解决方案1】：

如果您只需要找到 3 个元素的子序列，最有效的方法是迭代整个数据。

很容易证明：您必须所有搜索算法检查整个数组。

在此算法中，您最多可以执行 3 次。这是您可以获得的最佳复杂性。

【讨论】：