使用中位数Algo O(n)的中位数查找未排序数组(包含重复数)中的第n个最大数字时出错

时间:2012-07-07 22:39:54

标签: java

如果数组包含1,7,7,3,6并且如果用户询问第二大元素是什么,则输出应为7(而不是6),因为重复值被视为不同。
这是我的代码 我正在使用确定性搜索找到合适的支点 它的复杂性是O(n) 我遇到了代码生成的错误 请帮帮我。

import java.util.Random;
import java.util.Scanner;


public class deven  {

    public static void main(String args[]){
        Scanner in=new Scanner(System.in);
        int len=in.nextInt();
        int n=in.nextInt();
        int array[]=new int[len];
        for (int i = 0; i < len; i++) {
            array[i]=in.nextInt();
        }


        System.out.println(select(array,len,n));

    }

    static int below[];
    static int above[];
    static int pivot;
    static int i;
    static int j;
    static int x;
    static int y;
    static int index;
    static Random rand=new Random();
    static int select(int array[],int len,int n){

        if(len==1)
            return array[0];
        pivot=pivot(array, len);

        below=new int[len];
        above=new int[len];
        //System.out.println("Block");
        x=0;
        y=0;
        int temp=0;
        for(i=0;i<len;i++){
            if(array[i]>pivot){
                below[x++]=array[i];
            }
            else if(array[i]<pivot){
                above[y++]=array[i];
            }
            else {
                if(temp!=0){
                below[x++]=array[i];
            }
                temp=1;
        }
        }

        i = x;
           j = len - y;
        if(n<i) return select(below,x,n);
        else if(n>=j) return(select(above,y,n-j));
        else  return(pivot);



    }

    static int pivot(int array[],int len){
        if(len==1){
            return array[0];
        }
        int numOfGroups=len/5;
        if(len%5!=0){
            numOfGroups++;
        }

        int setOfMedians[]=new int[numOfGroups];
        for (int i = 0 ; i < numOfGroups ; i++)
        {
            int[] subset;
            if(array.length % 5 > 0)
            {
                if (i == numOfGroups - 1)
                {
                    subset = new int[array.length % 5];
                }
                else
                {
                    subset = new int[5];
                }
            }
            else
            {
                subset = new int[5];
            }
            for (int j = 0; j < subset.length ; j++)
            {
                subset[j] = array[5*i+j];
            }
            setOfMedians[i] = median(subset);
        }

        int goodpivot=select(setOfMedians, numOfGroups,numOfGroups/2 );
        return goodpivot;

    }
    static int median(int[] array)
    {
        if (array.length == 1)
        {
            return array[0];
        }
        int smallerCount = 0;
        for (int i = 0 ; i < array.length ; i++)
        {
            for (int j = 0 ; j < array.length ; j++)
            {
                if (array[i] < array[j])
                {
                    smallerCount++;
                }
            }
            if (smallerCount == (array.length - 1)/2)
            {
                return array[i];
            }
            smallerCount = 0;
        }
        return -1; 
    }


}

输入
6
3
1 2 3 1 2 3
输出

Exception in thread "main" java.lang.StackOverflowError  
    at deven.pivot(deven.java:99)  
    at deven.select(deven.java:34)  
    at deven.pivot(deven.java:102)  
    at deven.select(deven.java:34)  
    at deven.select(deven.java:59)  
    at deven.select(deven.java:59)  
    at deven.select(deven.java:59)  

2 个答案:

答案 0 :(得分:1)

问题是你的中位数方法。它不应该返回-1。在中位数方法的最后一行,而不是

return -1;

将其更改为

return array[rand.nextInt(array.length)];

请注意,此修复只是尝试修复您的错误。在中位数方法不返回中位数的意义上,这不是一个好的解决方案。我认为应该重构应用程序。修复的想法实际上是在pivot方法中。一个好的支点是中位数。但是如果你无法有效地找到中位数,那么一个数组可以在数组中随机选择。

更新

让我们修正中位数方法:

static int median(int[] array) {
    if (array.length == 0) {
        throw new IllegalArgumentException("array cannot be empty.");
    }

    int mid = array.length / 2;
    for (int candidate : array) {
        int lower = 0;
        int higher = 0;
        for (int value : array) {
            if (value < candidate) {
                lower++;
            }
            else if (value > candidate) {
                higher++;
            }
        }
        if (lower <= mid && higher <= mid) {
            return candidate;
        }
    }
    throw new IllegalStateException();
}

答案 1 :(得分:1)

如果除了smallCount之外还维持了equalsCount,那么你应该能够检测到你的候选值是否也是重复的中位数。

(解释)

当您的中位数方法意外失败时,您似乎故意将-1作为无效值返回。抛出某种异常会更合适,但你真正想要的是它永远不会达到这一点。

当中位数重复时,您的算法会失败。例如,在集合{1,2,2,2,3}中,2是明显的中位数,但是从来没有一个点正好有2个值“小于”任何被验证的值。

如果计算较小和相等的值,那么如果您当前的测试通过,或者如果较小的计数小于中点并且较小的+相等的计数大于中点,则您可以知道您的候选者是中位数

相关问题