要在一个序列里找出第K小元素,可以用排序算法,然后再找。可以证明,排序算法的上界为O(nlogn)。

在这里,给出两种可以在线性时间内找出第K小元素的方法。

方法1:

(1) 选定一个比较小的阈值(如44),当序列元素小于阈值时,直接用排序算法来做;

(2) 当序列元素大于阈值时,把元素划分为以5个元素为一组,每一组元素自身作排序,然后挑出每一组元素的中间值,再在所有的中间值中,递归调用本算法,挑出中间值,可以认为,此值大约为整个序列的中间值(当序列元素个数不是5的倍数时,最后一组不足5的舍掉,这个对中间值影响不大);

寻找第K小元素

(图片参考《ALGORITHMS DESIGN TECHNIQUES AND ANALYSIS》 M. H. Alsuwaiyel)

(3) 把元素按中间值划分为三组,第一组小于中间值,第二组等于中间值,第三组大于中间值;

(4) 若第一组的元素个数大于等于K,即第K个元素在第一组内;若第一组和第二组的元素个数大于等于K,即中间值为第K个元素;否则,第K个元素在第三组,再递归调用本算法,注意K要减去一二组的元素个数。

    public static int select(int[] A, int k){
        return selectDo(A, 0, A.length-1, k);
    }
    
    private static int selectDo(int[] A, int low, int high, int k){
        //select k min number
        int p = high - low + 1;
        if(p < 44){
            Arrays.sort(A, low, high+1);
            return A[low+k];
        }
        //A divided into q groups, each group 5 elements, and sort them
        int q = p/5;
        int[] M = new int[q];
        for(int i = 0; i < q; i ++){
            Arrays.sort(A, low + 5*i, low + 5*i + 5);
            M[i] = A[low+5*i+2];
        }
        //select mid in M
        int mid = selectDo(A, 0, q-1, (q-1)/2);
        //A divided into 3 groups
        int[] A1 = new int[p];
        int[] A2 = new int[p];
        int[] A3 = new int[p];
        int count1, count2, count3;
        count1 = count2 = count3 = 0;
        for(int i = low; i <= high; i ++){
            if(A[i] < mid)
                A1[count1++] = A[i];
            else if(A[i] == mid)
                A2[count2++] = A[i];
            else
                A3[count3++] = A[i];
        }
        if(count1 >= k)
            return selectDo(A1, 0, count1-1, k);
        if(count1 + count2 >= k)
            return mid;
        return selectDo(A3, 0, count3-1, k-count1-count2);
    }
Java

相关文章: