【问题标题】:Concurrency problem with arrays (Java)数组的并发问题(Java)
【发布时间】:2010-05-29 17:53:29
【问题描述】:

对于我正在研究的算法,我尝试开发一种黑名单机制,可以以特定方式将数组列入黑名单:如果“1、2、3”被列入黑名单,“1、2、3、4、5”也被列入黑名单被列入黑名单。
到目前为止,我对我提出的解决方案感到非常满意。但是当我从多个线程访问黑名单时,似乎出现了一些严重的问题。方法“包含”(参见下面的代码)有时会返回 true,即使数组未列入黑名单。如果我只使用一个线程,则不会出现此问题,因此很可能是并发问题。
我试过添加一些同步,但它没有改变任何东西。我还使用 java.util.concurrent 类尝试了一些稍微不同的实现。有关如何解决此问题的任何想法?

public class Blacklist {

private static final int ARRAY_GROWTH = 10;

private final Node root = new Node();

private static class Node{

    private volatile Node[] childNodes = new Node[ARRAY_GROWTH];

    private volatile boolean blacklisted = false;

    public void blacklist(){
        this.blacklisted = true;
        this.childNodes = null;
    }
}

public void add(final int[] array){

    synchronized (root) {

        Node currentNode = this.root;

        for(final int edge : array){
            if(currentNode.blacklisted)
                return;

            else if(currentNode.childNodes.length <= edge) {
                currentNode.childNodes = Arrays.copyOf(currentNode.childNodes, edge + ARRAY_GROWTH);
            }

            if(currentNode.childNodes[edge] == null) {
                currentNode.childNodes[edge] = new Node();
            }

            currentNode = currentNode.childNodes[edge];
        }

        currentNode.blacklist();
    }


}

public boolean contains(final int[] array){

    synchronized (root) {

        Node currentNode = this.root;

        for(final int edge : array){
            if(currentNode.blacklisted)
                return true;

            else if(currentNode.childNodes.length <= edge || currentNode.childNodes[edge] == null)
                return false;

            currentNode = currentNode.childNodes[edge];
        }

        return currentNode.blacklisted;

    }

}

}

【问题讨论】:

  • 我觉得没问题。同步应该防止所有问题同时调用 add 和 contains,所以我猜你的问题出在调用它们的代码上。顺便说一句,通过同步,您无需在节点 volatile 中声明变量。
  • 对我来说看起来也不错 :) 变量只是易变的,因为我认为它可能会有所帮助。但它们是否不稳定似乎没有什么区别。
  • 为什么黑名单方法是公开的?你确定没有其他线程调用它吗?
  • @Istao,黑名单方法在私有内部类节点中,除非他们得到根节点的引用(他们没有),否则没有人可以调用它。
  • @Istao,它在一个私有内部类中,所以没有人可以从外部调用它——至少如果上面是Blacklist 的完整定义。 @Johannes,是这样吗?

标签: java arrays concurrency


【解决方案1】:

编辑: 我通过一个包含十个线程的测试套件运行您的代码,并添加和比较了数千种模式,但我发现您的实现没有任何问题。我相信你误解了你的数据。例如,在线程环境中,这有时会返回 false:

// sometimes this can be false
blacklist.contains(pattern) == blacklist.contains(pattern);

另一个线程在第一次调用之后但在第二次调用之前更改了黑名单。这是正常行为,类本身无法阻止它。如果这不是您想要的行为,您可以从类外同步它:

synchronized (blacklist) {
    // this will always be true
    blacklist.contains(pattern) == blacklist.contains(pattern);
}

原始回复:
您同步根节点,但这不会同步它的任何子节点。要使您的课程防弹,您所要做的就是同步 add(int[])contains(int[]) 方法,然后不要泄漏任何引用。这确保了一次只能有一个线程使用黑名单对象。

我在试图理解它的同时摆弄了你的代码,所以你不妨拥有它:

import java.util.HashMap;
import java.util.Map;
import java.util.Stack;

public class Blacklist {
    private final Node root = new Node(Integer.MIN_VALUE, false);

    public synchronized void add(int[] array) {
        if (array == null) return;
        Node next, cur = root;

        for(int i = 0; i < array.length-1 && !cur.isLeaf(); i++) {
            next = cur.getChild(array[i]);

            if (next == null) { 
                next = new Node(array[i], false);
                cur.addChild(next);
            }

            cur = next;
        }

        if (!cur.isLeaf()) {
            next = cur.getChild(array[array.length-1]); 
            if (next == null || !next.isLeaf())
                cur.addChild(new Node(array[array.length-1], true));
        }
    }

    public synchronized boolean contains(int[] array) {
        if (array == null) return false;
        Node cur = root;

        for (int i = 0; i < array.length; i++) {
            cur = cur.getChild(array[i]);
            if (cur == null) return false;
            if (cur.isLeaf()) return true;
        }

        return false;
    }

    private static class Node {
        private final Map<Integer, Node> children; 
        private final int value;

        public Node(int _value, boolean leaf) { 
            children = (leaf?null:new HashMap<Integer, Node>());
            value = _value;
        }

        public void addChild(Node child) { children.put(child.value, child); }
        public Node getChild(int value) { return children.get(value); }
        public boolean isLeaf() { return (children == null); }

    }
}

Collections framework 可以让您的事情变得更轻松。重新实现 ArrayList 并没有给自己带来任何好处。

这里我使用了 HashMap,这样您就不必为这样的事情分配超过 9000 个引用:

blacklist.add(new int[] {1, 2000, 3000, 4000});

【讨论】:

  • "你要做的就是让你的类防弹,同步 add(int[]) 和 contains(int[]) 方法,然后不要泄露任何引用。 - 他已经完成了这一切......从挑剔的角度来看,您在Blacklist 对象本身上的同步实际上比他在内部root 对象上的同步更容易受到攻击,因为后者对任何人都不可见在外面,所以只有这个Blacklist 实例可以锁定它。
  • 非常感谢,您的代码运行良好。仍然不太清楚为什么,但我明天会仔细研究一下。
    而且我知道 Collections 框架。只是想如果我使用一个简单的数组可能会稍微快一点:)
    无论如何,再次感谢。
  • HashMap 版本对小数字的表现大致相同(约 3% 的差异)。您的版本需要更多的工作来编写,更难阅读,在负数上崩溃,并且在大数上耗尽堆空间。 :)
  • 证明你是对的。真正的问题是,一个数组被一个线程列入黑名单,而另一个线程仍然假设它没有被列入黑名单。您的解决方案没有发生这种情况,因为它的行为与我的完全不同。现在我知道这实际上很明显。无论如何,再次感谢您的帮助。漫长的白天和愉快的夜晚;)
  • 愿你有两倍的数字。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2014-06-17
  • 1970-01-01
  • 2019-04-13
  • 1970-01-01
相关资源
最近更新 更多