数据结构相关重点（个人总结）

头结点优点：
*链表在第一个位置上的操作和在表的其他位置上的操作一致。
*空表和非空表的处理一致。
对链表进行修改的，函数参数需要加&地址符。
创建指针变量：LNode *s;
单链表访问后继节点O(1)，访问前驱结点O(n)；
删除结点记得free();
对循环单链表，在表头和表尾都要进行操作时，选择设尾指针。设头指针操作表尾需要O(n)，设尾指针操作表头表尾都只需O(1)；
循环双链表 = 双循环链表
静态链表与顺序表的区别：静态链表的插入、删除只需要修改指针，不需要移动元素。
顺序表随机存取，链表顺序存取。
链表空间分配操作灵活、高效。
链式存储结构的存储密度小于1;
顺序表实现较简单
循环单链表：尾指针指向表头，头指针（如果有的话）不能指向表尾。即只有队首指针的循环单链表无法直接访问表尾。只有队尾指针的循环单链表可以直接访问表头表尾。错题P39 19
循环双链表：尾指针指向表头，头指针也可以指向表尾，因此有一个就行。即只有队首指针或只有队尾指针的循环双链表（有任意一个就行）可以直接访问表头表尾。错题P39 20
将长度为n的单链表链接在长度为m的单链表后面，时间复杂度为O(m)
为了方便插入和删除数据，可以使用双链表存放数据。

三、栈和队列

3.1 栈

栈可以为空栈
卡特兰（Catalan）数：n个不同的元素进栈，出栈元素不同的排列个数为[1/(n+1)]*Cn2n
注意区分栈顶指针top指向栈顶元素或栈顶元素下一位的情况，这两种情况下出入栈的操作有所不同（先+-下标再读栈，还是先读栈再+-下标。）
共享栈：两个栈的栈顶指针都指向栈顶元素，top0 = -1时0号栈为空，top1 = MaxSize时1号栈为空。top1 - top0 = 1时，栈满

注意是b op a

3.2 队列

循环队列：

队首指针进1：Q.front = (Q.front + 1) % MaxSize; （MaxSize指最大容量，不是下标。例如A[0..6]，MaxSize为7。）

队尾指针进1：Q.rear = (Q.rear + 1) % MaxSize;

队列长度：(Q.rear + MaxSize - Q.front) % MaxSize;

队满条件：(Q.rear + 1) % MaxSize = Q.front; （即留了一个空白的位置，作为判断是否队满的依据。此时队尾指针指向队尾元素的下一位，队头指针指向队头元素。）

队空条件：Q.front = Q.rear;

队中元素个数：(Q.rear - Q.front + MaxSize) % MaxSize; （注意是尾减头）

2. 带头结点的链队列，执行出队操作时，如果当前结点是队列中最后一个结点，删除该结点后，需要把队尾指针指向头结点。

3.3 栈和队列的应用

1. 后缀计算表达式值：扫描到操作符<op>时，连续从栈中退出两个操作数X,Y，形成运算指令X<op>Y（注意X，Y的顺序，是X<op>Y）。

2. 注意中缀表达式转后缀的方法和过程。P94 2、P95 11、P96 12

3.对于一个问题的递归算法求解和其对应的非递归算法求解，非递归算法通常效率高一些。

四、串

1. 字符串’aba’ 前缀为a，ab。后缀为a，ba（注意不是ab）。

2. KMP：O(n+m)

3. next数组求法：求出子串各位置最大相等前后缀长度；向右移一位；加1。

4. nextval数组求法：P118 7多做几遍

第一步：令nextval[1] = next[1] = 0; （next数组是右移加1的版本，从j = 1向j= n方向判断）

第二步：从j = 2开始，依次判断pj是否等于Pnext[j]？将next[j]修正为next[next[j]]，直至pj不等于Pnext[j]为止：continue;

五、树与二叉树

5.1 树的基本概念

1. 树的根节点没有前驱，除根节点外所有结点有且只有一个前驱。

2. 树中所有结点可以有零个或多个后继（1对多）

3. 度大于0的结点称为分支节点（又称非终端结点）（根结点也算）

4. 结点深度从根结点开始向下逐层累加，结点高度从叶结点开始自底向上逐层累加。

5. 路径是结点序列。路径长度是边的个数（树中路径自上向下）。

6. 森林是m(m >= 0。0棵、1棵也算森林)棵互不相交的树之集合。

7. 树的性质

1）树中结点数 = 所有结点度数 + 1；

2）度为m的树，第i层上至多有mi-1个结点（i >= 1）。

3）高度为h的m叉树至多有(mh-1)/(m - 1)个结点。

4）具有n个结点的m叉树最小高度为⌈logm(n(m - 1) + 1)⌉

8. 树的路径长度是从树根到每个结点路径长度的总和。

5.2 二叉树的概念

二叉树是有序树。叉树将其左、右子树颠倒，则成为另一棵不同的二叉树。即使树中结点只有一棵子树，也要区分左右子树。
二叉树与度为2的有序树区别：
完全二叉树：若有度为1的结点，则只可能有一个，且该结点只有左孩子而无右孩子。
二叉树的性质：非空二叉树上的叶子结点数等于度为2的节点数加1，即n0 = n2 + 1。
非空二叉树第k层至多2^(k-1)个结点。
高度为h的二叉树至多2^h - 1个结点。
结点i所在层次（深度）为⌊log2i⌋+ 1
具有n（n > 0）个结点的完全二叉树高度（5.1.7.4)中为最小高度）为⌈log2(n + 1)⌉
含有n个结点的二叉链表中，含有n + 1个空链域。（2n0 + n1 = n0 + n2 + 1 + n1 = n + 1）
若n为奇数，则每个分支结点都有左孩子和右孩子；若n为偶数，则编号最大的分支结点（编号n/2）只有左孩子，没有右孩子。（用于选择题，判断最后一层叶子结点数量，或者知道n0和n，判断n1数量）P133 16

5.3 二叉树的遍历和线索二叉树

1. 三种遍历算法（先、中、后序）时间复杂度都是O(n)，递归空间复杂度恰好为树的深度，最坏能到O(n)

2. 在二叉树中有结点n、m，若m是n祖先，则使用后序遍历可以找到m到n路径。

3. 二叉线索树是一种物理结构

4. 在中序线索树中，若某结点有左孩子，则其前驱结点是它的左子树的最右下结点 P148 27

5. 后序线索树的遍历仍需要栈的支持（线索树的遍历相当于找后驱，后序后驱需要栈）

6. 先序序列为a,b,c,d的不同二叉树个数为14（卡特兰数，先序入栈，中序出栈）P149 34

5.4 树、森林

1. 树和森林的遍历与二叉树遍历的对应关系

5.5 树与二叉树的应用

1. 二叉排序树的删除

1）右子树空，用左子女填补。

2）左子树空，用右子女填补。

3）左右子树均不空，在右子树上找中序第一个子女填补。 P185 图5.24

2. 二分查找的判断树唯一，而二叉排序树的查找不唯一。

3. 有序表是静态查找表时，宜用顺序表作为其存储结构；有序表是动态查找表，则应选择二叉排序树作为其逻辑结构。

4. 平衡二叉树的插入

1）LL平衡旋转。（旋转左孩子）

2）RR平衡旋转。（...右孩子）

3）LR平衡旋转。（...左孩子右子树根节点）

4）RL平衡旋转。（...右孩子左子树根节点）

P187

5. 平衡二叉树高度公式：

n0 = 0, n1 = 1, n2 = 2;

nh = nh-1 + nh-2 + 1(1是根节点)

6. 哈夫曼树的权值来自结点。

7. 哈夫曼树特点：

1. 每个初始结点最终都成为叶结点，且权值越小的结点到根节点的路径长度越大。

2. 构造过程中新建了n - 1个结点（双分支结点），因此哈夫曼树总结点数为2n - 1。

3. 每次都选择两棵树作为新结点的孩子，因此哈夫曼树中不存在度为1的结点。

8. 度为m的哈夫曼树中，叶子结点个数为n，则非叶子结点个数为：⌈(n - 1)/(m - 1)⌉。

解释：每层m - 1个，最底层m个，设除最底层和第一层外有x层。

即n = x(m - 1) + m。

所以x = (n - m)/(m - 1)。又非叶子结点个数为：x + 1（1是根结点）

所以x + 1 = [(n - m) + (m - 1)] / (m - 1)，即⌈(n - 1)/(m - 1)⌉

9. 所有非叶结点的平衡因子均为1，即平衡二叉树满足平衡的最少结点情况。 P193017

6.1 图的基本概念

图的边集可以为空，顶点集不能为空。
有向图中，有箭头的那边是弧头。
简单图：不存在重复边和自环。
完全图：无向：n(n - 1)/2；有向：n(n - 1)
子图：（v属于V）&&（e属于E）
生成子图：包含所有顶点。
连通分量：极大（连通子图包含其所有的边）连通子图（无向图）
图有n个顶点，边小于n-1（等于n-1也未必连通，有环情况下），必不连通。
极大：连通子图包含其所有的边
极小：保持图连通的最少边
强连通图（有向图）：有路径就行，不需要直接相连。
生成树：连通图的一个极小生成子图
无向图的度：2e
有向图的度：e（一个出/入度代表了一条边）
网：带权图
环不是简单路径
除第一个和最后一个顶点外，其余顶点不重复出现的回路称为简单回路。
若一个具有n个顶点，e条边的无向图是一个森林，则该森林中必有n - e棵树 P213 18

6.2 图的存储及基本操作

1. 设图G的邻接矩阵为A，An的元素An[i][j]等于由i到j长度为n的路径数目。

2. 无向图的邻接矩阵一定对称且唯一。

3. 无向图邻接表存储空间O(|V| + |2E|)

4. 邻接矩阵用法：遍历

P =G.vertices[i].firstarc;

P = p->nextarc;

6.3 图的遍历

1. 图的广度优先搜索算法是二叉树的层次遍历算法的扩展。

2. 邻接矩阵：BFS/DFS生成树唯一；邻接表：BFS/DFS生成树不唯一。

3. BFS和DFS：对每个连通分量调用一次。

4. 基于邻接矩阵的遍历所得到的的DFS序列和BFS序列唯一，基于邻接表的不唯一。

5. DFS/BFS：空O(V)，时（表O(V+E)，矩阵O(V2)）

6. Dij不能带负权环/负权边

7.拓扑：有向无环图，顶点表示活动。时间复杂度邻接表O(V+E)，邻接矩阵O(n2)。

8. 拓扑排序算法：

1）从AOV网中选择一个没有前驱的顶点输出。

2）删除该顶点和以它为起点的有向边。

3）重复1）、2）直到当前AOV网为空或当前网中不存在无前驱结点为止。后一种情况说明有向图中存在环。

当一个顶点有多个后继结点，拓扑结果通常不唯一；如果各顶点线性有序，有唯一前后继，则拓扑唯一。

充分条件：

邻接矩阵是三角矩阵 --> 存在拓扑序列

9.AOE（Activity On Edge）顶点表示事件，有向边表示活动。

10. AOE中边有权值，AOV中没有。

1）不能随意缩短关键活动，缩太短可能变成非关键路径。

2）对于多条关键路径，同时缩短才能达到缩短工期的目的。

3）若有向图拓扑有序序列唯一，则图中每个顶点的入度和出度最多为1（X）P249 14

4）若有向图拓扑有序序列唯一，则可以唯一确定该图（X）同上 P250 19

查找

7.1 ~ 7.2 二分、顺序查找

二分：元素个数为n时树高h=⌈log2(n + 1)⌉（也是关键字比较的最多次数，最多次数与最少次数相差1），与具有n（n > 0）个结点的完全二叉树高度相同。
一般线性表和有序线性表，顺序查找的成功ASL相同，都是(n + 1)/2。
顺序查找失败ASL=n+1，有序顺序表查找失败ASL = n/2 + n/(n + 1)；
对2500个记录的索引顺序表（分块表）进行查找，最理想的块长为n1/2 P277 17、19