查找数所在的集合称为查找表。是由同一类型的数据元素(或记录、行)构成的集合。查找表中的列称为字段或数据项。关键字是数据元素中某个数据项的值,他可以唯一标识一个数据元素(记录)。
查找就是根据给定的某个值,在查找表中确定一个关键字等于给定值的数据元素或记录的过程。通过查 找能找到该记录或这个记录中的数据项。
查找表的分类:
静态查找表:只做查找的操作的查找表
动态查找表:在查找的过程中同时进行插入或删除操作的查找表
为了提高查找的效率,需要专门设置顺序表、树等数据结构,面向查找操作的数据结构称为查找结构。
顺序查找又叫线性查找,是最基本的查找技术,保存在顺序查找表中的数据是不保证有序。查找过程就 是从表的第一个记录开始,逐个记录的将记录关键字与给定查找值比较,如果相等则查找成功,查到最后都没有找到记录查找不成功
查找表中记录是按关键字有序存储的称为有序表。有序表可以使用折半查找方法查找,以提高查找效 率。
折半查找也称为二分查找,查找的前提是线性表中记录是按关键字有序存储的,并且必须采用顺序存储。查找思想是:在有序表中取出中间记录作为比较对象,若关键字与给定值相等,则查找成功。若给 定值小于这个关键字,则在中间记录的左边半区继续查找;若给定值大于这个关键字,则在中间记录的 右边半区继续查找,不断重复上述过程,直到查找成功或失败。
大数据时代,建立索引是提高查找速度的重要手段。
索引是把一个关键字与它对应的记录相关联的过程,一个索引由若干个索引项构成,每个索引项至少应
该包含关键字和其对应的记录在存储器中的位置等信息。
索引按结构分为:
线性索引:将索引项集合组织为线性结构,称为索引表
稠密索引:在线性索引中,将数据集中的每个记录对应一个索引项。索引项按关键字有序排
序这样提高查找效率
分块索引:把数据集记录分成若干块,块内无序,块间有序。
倒排索引:搜索引擎基本实现原理。不是由记录来确定属性值,而是属性值确定记录位置。
当根据属性值查找时找到这个属性在哪个文章中。

684

被折叠的 条评论
为什么被折叠?



