【问题标题】:Java: KMP matcher algorithmJava:KMP 匹配器算法
【发布时间】:2016-05-29 07:13:52
【问题描述】:

我正在尝试用 Java 实现上述算法。但是我遇到了一个超出范围的异常,我不知道如何解决这个问题。

我只是在逐行翻译伪代码。

代码如下:

public static int[] computePrefixFunction(String input) 
    {
        int[] pi = new int[input.length()];
        int k = 0;
        for (int q = 1; q < input.length(); q++) {
            char target = input.charAt(q);
        while (k > 0 && input.charAt(k) != target) k = pi[k - 1];
        if (input.charAt(k) == target) k++;
        pi[q] = k;
    }
    return pi;
}

public static Queue<Integer> KMPMatcher(String T, String P) 
{
    int n = T.length();
    int m = P.length();
    int[] pi = computePrefixFunction(P);
    int q = 0;
    Queue<Integer> Q = new LinkedList<>();
    for(int i = 0; i < n; i++) 
    {
        while(q > 0 && P.charAt(q+1) != T.charAt(i)) 
            q = pi[q];
        if(P.charAt(q+1) == T.charAt(i)) 
            q = q + 1;
        if(q == m-1) // you match it when q reaches size of pattern -1. :)
        {
            Q.add(i-m+1); // Change it as well.
            q = pi[q];
        }     
    }
    return Q;
}

public static void main(String[] args) {
    System.out.println(KMPMatcher("bdacabdacb","bda"));
}

编辑:我已经用下面的 piyush 实现更新了代码,纠正了我的一些问题。但是还有一个问题。

我使用这些测试了 KMPMatcher:

1) System.out.println(KMPMatcher("bacabab","bab")); // returned[2,4]

2) System.out.println(KMPMatcher("bdacabdacb","bab")); // returned[3]

数字 1 应该只返回 4,数字 2 应该只返回一个空列表。为什么会这样?我正在尝试使用这些输入绘制跟踪并将其与伪代码进行比较。我认为这与if(q==m-1) 中的索引有关(因为与伪代码版本相比,它没有比较正确的东西?)而且我不确定如何修复它。请问有什么帮助吗?

【问题讨论】:

  • 前缀函数是正确的,我已经测试过了,它返回了预期的结果。只有 KMPMatcher 方法有错误
  • 如果您能告诉我们异常发生在哪一行,将会非常有帮助。
  • @StephaneM 抱歉我已经更新了

标签: java algorithm knuth-morris-pratt


【解决方案1】:

问题出在if 语句中。它不应该是if (q == m-1)

public static int[] computePrefixFunction(String input) 
    {
        int[] pi = new int[input.length()];
        int k = 0;
        for (int q = 1; q < input.length(); q++) {
            char target = input.charAt(q);
        while (k > 0 && input.charAt(k) != target) k = pi[k - 1];
        if (input.charAt(k) == target) k++;
        pi[q] = k;
    }
    return pi;
}

   public static Queue<Integer> KMPMatcher(String T, String P) 
{
    int n = T.length();
    int m = P.length();
    int[] pi = computePrefixFunction(P);
    int q = 0;
    Queue<Integer> Q = new LinkedList<>();
    for(int i = 0; i < n; i++) 
    {
        while(q > 0 && P.charAt(q) != T.charAt(i)) 
            q = pi[q-1];
        if(P.charAt(q) == T.charAt(i)) 
            q++;
        {
            Q.add(i-q+1); // Change it.
            q = pi[q-1];
        }     
    }
    return Q;
}

public static void main(String[] args) {
    System.out.println(KMPMatcher("bdacabdacb","bda"));
}

【讨论】:

  • 这个解决方案没有问题吗?它返回 [-1,4] 但它​​应该是 [1,5]
  • 我发现您的 KMP 匹配器存在一些问题:使用字符串 "bacababa" 和模式 "bab 它返回 [2,4] 但结果中不应该出现 2。并且使用字符串 "bdacabdacb" 和模式"bab" 它返回 [3] 这是不正确的。为什么会这样?
  • 嘿,谢谢你指出这一点。对代码做了一些改动。问题出在“ Q.add(i-m+1) ”中。您应该再次检查算法。
猜你喜欢
  • 2011-06-18
  • 2018-10-16
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2013-05-18
  • 2016-07-02
  • 2015-10-20
  • 2010-10-15
相关资源
最近更新 更多