【发布时间】:2014-04-03 07:19:33
【问题描述】:
是否有任何算法/工具来检测离散符号输入序列中的先验未知模式?
例如,对于字符串“01001000100001”,它类似于 ("0"^i"1"), 对于“01001100011100001111”,它就像 ("0"^i"1"^i)
我找到了一些方法,但它们适用于在序列中检测的一组模式是先验已知的。我还发现sequitur algorithm 用于数据中的层次结构检测,但是当序列像我的示例中的“算术级数”时它不起作用。
因此,我将非常感谢有关方法/算法/工具/科学论文的任何信息。
【问题讨论】:
-
尝试查看用于分支预测的算法,它们可能会有所帮助。
-
是否需要检测像
"0"^(i^2)"1"这样的“非线性”模式,比如顺序01000010000000001...? -
是的,必须识别“非线性”
-
很确定“任何模式”的一般情况无法解决,这听起来太像Kolmogorov Complexity。您正在寻找的模式是否只是一个正则表达式?它可能会简化事情。 (不知道有没有)
-
“任何模式”的情况是最好的,但由于其复杂性,我希望找到一种从特定集合(尽可能广泛)中检测模式的特定方法。所以任何一套都能满足我,但越多越好
标签: algorithm machine-learning artificial-intelligence