数据结构第9章检索

最新推荐文章于 2025-01-27 12:20:30 发布

原创最新推荐文章于 2025-01-27 12:20:30 发布 · 686 阅读

4 ·

本内容遵循CC 4.0 BY-SA版权协议

标签

#蓝桥杯

数据结构专栏收录该内容

1 篇文章

订阅专栏

本文探讨了检索算法的效率衡量标准——平均查找长度（ASL），并详细介绍了顺序查找、二分查找以及分块检索三种算法。顺序查找简单但效率较低，平均查找长度在成功和失败时有所不同。二分查找适用于已排序的线性表，平均查找长度更优。分块检索结合了顺序和二分查找的优点，适用于动态查找表。文章还讨论了如何通过优化检索概率来提升检索效率。

首先，必须强调一下，这还是我在数据结构专栏写的第一篇博客，之前虽然写了机器学习的博客，但都不怎么样，所以希望这篇博客能够比较优质吧...

检索算法效率的衡量

衡量检索算法效率的标准是平均查找长度(Average Search Length,ASL）也就是为确定某一个结点在数据集合中的位置，给定值与集合中的结点关键字所需进行的比较次数

$ASL=\sum_{i=1}^{n}Pi*Ci$

线性表的检索

1.顺序检索

顺序检索是一种最简单的查找方法，基本思想是从表的一端开始，顺序(逐个)扫描线性表，依次将扫描到的结点关键字和给定值得Key进行比较，若相匹配则检索成功，若检索一遍之后依旧没有相匹配的值，则检索失败。

检索从后往前不断将待查找元素Key和当前元素比较，我们从后往前，每一次将当前元素与待查找元素进行比较前都需要判断是否已经查找完成即（K>=0），我们可以在线性表的最前面设置一个与待查找关键字等值的数据元素，作为监视查找是否完成的“哨兵"，这样再循环查找过程中就不需要每次判断是否查找完成。

基于链表的顺序检索算法从链表的第一个结点开始向前往后查找，成功则放回数据所在的地址，查找失败则返回NULL

顺序查找优点是简单到不能再简单，但缺点是查找时间长

顺序查找成功是的平均查找长度为：

$ASLseq=\sum_{i=0}^{n-1}\frac{1}{n}\cdot (n-i)=(n+1)/2$

对于每次关键字的查找，因为是从后往前查找嘛，所以第i个元素被查找的次数为n-i，利用等差数列的求和公式可以推出结果为(n+1)/2

查找失败时，算法的平均查找长度为：

$ASLseq=\sum_{i=0}^{n-1}\frac{1}{n}=n$

对于每次关键字的查找，都需要遍历完整个顺序表才能完成，所以都是n次，概率为1/n，最终为n

有的时候表中各个记录的查找概率并不相等，若能事先知道每个结点的检索概率，并按照检索概率升序排列（如果从前往后检索，则为降序排列）线性表中的结点，则ASl可以取得极小值，按照以上思路我们可以在每个结点中附设一个访问频度域，并不断动态排序，所以这种最好采用链式表的存储方式

二分法检索：

二分检所又称为折半查找，，要求线性表按关键字从小到大或者从大到小排序。以下为二分检索法的非递归与递归实现算法：

int binsearch(seqlist l,int key)//非递归
{
     int low = 0,high =l.len-1,mid;
     while(low<=high)
     {
         mid=(low+high)/2;
         if(l.data[mid]==key)  return mid;

         if(l.data[mid]>key)   high=mid-1;
         else  low=mid+1;
     }
     return -1;
}

int binsearch2(sqlist l,int key ,int low,int high)#递归
{
	int mid,k;
	if(low>high)
	return -1;
	
	if(l.data[mid]==key)
	return mid;
	if(l.data[mid]>key)
	return binsearch2(l,key,low,mid-1);
	else
	return binsearch2(l,key,mid-1,high);
 }

设 $n={2_{}}^{k}-1$ ,线性表之多被平分k次即可完成查找。也就是最坏 $k=log_{2}^{}(n+1)$ 次即可结束。