中位数和顺序统计学之求解顺序统计量

本文介绍了顺序统计量的概念,即如何快速找出一组数中的第K小元素。传统排序方法时间复杂度为O(nlogn),但通过分割算法可以在O(n)的时间复杂度内解决。分割算法将数组分为两部分,枢轴元素左侧是小于枢轴的元素,右侧是大于枢轴的元素。根据K值与枢轴位置的关系,递归在相应侧继续查找,实现寻找第K小元素。Java实现的算法参考《算法导论》。

1,顺序统计量介绍

顺序统计量其实就是,给定一组数如何快速有效地找出这组数中第K小的元素。

如找出:4,7,2,9,0,3   中第5小的元素。因为,0<2<3<4<7<9,故可以很容易地找出第5小的元素为7。但是,由于对于排序算法而言,最优的时间复杂度为O(nlogn),这意味着通过排序来查找第K小的元素的时间复杂度至少为O(nlogn),由于只关注一组数中的第K小元素,而不需要关注整个数组中的元素顺序。故有一种方法只需要O(n)的时间复杂度就可以求出顺序统计量。


2,分割算法在求解顺序统计量中的应用 ,分割算法的介绍参考:快速排序中的分割算法实现

经过一次分割之后,比枢轴元素小的元素都在枢轴的左边,比枢轴大的元素都在枢轴的右边。

故此时的枢轴元素就是第 pivot_index - low + 1 小的元素。其中,pivot_index表示枢轴元素的数组下标,low表示数组第1个元素的下标。

那么,当求解第K小元素时,若 K== pivot_index,则一次分割求得的枢轴元素就是第K小的元素了。

若 K > pivot_index,则表明第K小元素应该在枢轴元素的右边,递归在右边查找第K小元素

K < pivot_index, 则表明第K小元素应该在枢轴元素的左边,递归在左边查找第K小元素

由于分割算法的时间复杂度为O(n),平均来看,查找数组中的第K小元素的时间复杂度为O (n),由于用到了递归,中间结果需要压栈,故空间复杂度最坏情况下为O(n)。


3,求解第K小元素的JAVA实现如下,算法伪代码及详细解释参考《算法导论》

import java.util.Random;

public class RandomSelect {
	/*
	 * choose the k th small element in array
	 * @return the k th small element's value
	 */
	public int randomSelect(int[] arr, int low, int high, int i){
		if(i > arr.length || arr.length == 0)
			return -1;// -1 means illegal params
		
		if(low == high)
			return arr[low];//only one element in array
		
//		int pivot_index = randomPartition(arr, low, high);
		int pivot_index = partition(arr, low, high);
		int k = pivot_index - low + 1;//k 表示数组中 第 k 小的元素(第1小的元素为最小元素)
		
		/*
		 * i==k 意味着待求解的第i小元素就是上面求解的枢轴元素
		 * i<k 意味着第i小元素在第k小元素的左边,那么继续在左边递归查找第i小元素
		 * i>k意味着第i小元素在第k小元素的右边,继续在右边递归查找第i-k小元素,再加上前面的排序的k个元素,即可找到第i小的元素
		 */
		if(i == k)
			return arr[pivot_index];
		else if(i < k)
			return randomSelect(arr, low, pivot_index - 1, i);
		else
			return randomSelect(arr, pivot_index + 1, high, i - k);//i-k
	}
	
	
	/*
	 * split array
	 * this method always use the last elements as pivot.
	 * when the method finished, the left elements of array smaller than pivot.
	 * and the right elements of array larger than pivot.
	 * @return  the pivot element's index in array
	 */
	public int partition(int arr[], int low, int high) {
		int pivot = arr[high];
		int i = low - 1;
		for (int j = low; j < high; j++) {
			if (arr[j] <= pivot) {
				i++;
				swap(arr, i, j);
			}
		}
		swap(arr, i + 1, high);
		return i + 1;
	}
	
	/*
	 * create a random pivot and use it to partition array
	 */
	public int randomPartition(int[] arr, int low, int high){
		int rand = getRandom(low, high);
		swap(arr, arr[rand], arr[high]);//arr[high] is a random and will be as pivot
		return partition(arr, low, high);
	}
	
	/*
	 * return a random between min and max----[min, max]
	 */
	private int getRandom(int min, int max){
		Random random = new Random();
		return  random.nextInt(max + 1) % (max-min+1) + min;
	}
	
	/*
	 * switch two elements of arry
	 * @param int[] arr an array for switch
	 * @param int i, j index of array
	 * 
	 */
	private void swap(int[] arr, int i, int j){
		int tmp = arr[i];
		arr[i] = arr[j];
		arr[j] = tmp;
	}
}




评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值