数据库索引优化指南

最新推荐文章于 2026-05-12 08:11:34 发布

原创最新推荐文章于 2026-05-12 08:11:34 发布 · 932 阅读 ·

本内容遵循CC 4.0 BY-SA版权协议

GEO检测

m0_75107803

关注

标签

#数据库 #sql

分类数据库

数据库索引全面指南

一、索引基础概念

1. 索引定义

类比解释：类似书籍目录，通过页码快速定位内容
技术定义：存储在磁盘上的特殊数据结构，作为加速数据库查询的数据指针集合
核心价值：显著减少磁盘I/O操作，避免全表扫描

2. 索引优缺点对比

优势	缺点
加速SELECT查询	占用额外磁盘空间
提升JOIN/ORDER BY/GROUP BY性能	降低INSERT/UPDATE/DELETE效率（需维护索引）
强制实现唯一性约束	维护成本随数据量增长而提高

二、索引数据结构

1. B+树（默认结构）

特点：

数据仅存储在叶子节点（非叶子节点只保存索引键）
叶子节点形成双向链表（支持高效范围查询）
典型树高3-4层（千万级数据仅需3次I/O）

2. 哈希索引

仅Memory引擎支持
采用键值对存储（Key=哈希值, Value=行指针）
适用场景：精确等值查询（=），不支持范围查询

三、MySQL索引分类

1. 功能分类

类型	创建语法	特点	示例
主键索引	PRIMARY KEY	唯一且非空，每表仅有一个	`id INT PRIMARY KEY`
唯一索引	UNIQUE KEY	值必须唯一，允许NULL	`email VARCHAR(50) UNIQUE`
普通索引	INDEX/KEY	基础索引类型	`INDEX idx_name (name)`
全文索引	FULLTEXT	支持文本分词搜索	`FULLTEXT (content)`
空间索引	SPATIAL	地理数据专用	`SPATIAL INDEX (location)`

2. 存储结构分类

类型	支持引擎	特点
聚簇索引	InnoDB	数据行与索引存储在一起（主键即聚簇索引）
非聚簇索引	MyISAM/InnoDB	索引与数据分离存储（二级索引）

四、索引管理操作

1. 创建索引

-- 建表时创建
CREATE TABLE users (
    id INT PRIMARY KEY,
    email VARCHAR(50) UNIQUE,
    name VARCHAR(50),                   
    INDEX idx_name (name),
    FULLTEXT INDEX ft_bio (bio)
);

-- 已有表添加
ALTER TABLE orders ADD INDEX idx_amount (order_amount);
CREATE INDEX idx_date ON logs (create_time);

2. 查看索引

SHOW INDEX FROM users;

输出解析：

Non_unique: 0表示唯一索引，1表示非唯一
Seq_in_index: 列在索引中的顺序
Cardinality: 基数估算（值越大索引效果越好）
Index_type: 索引类型（BTREE/HASH/FULLTEXT）

3. 删除索引

ALTER TABLE users DROP INDEX idx_name;
DROP INDEX ft_bio ON users;

五、索引优化策略

1. 最左前缀原则

复合索引 (col1, col2, col3) 的有效查询：

WHERE col1 = 'A'                    -- √ 使用索引
WHERE col1 = 'A' AND col2 = 'B'     -- √ 使用索引
WHERE col2 = 'B'                    -- ✘ 不触发索引
WHERE col1 LIKE 'A%'                -- √ 前缀匹配

2. 索引失效场景

场景	示例	解决方案
列计算	`WHERE YEAR(create_time) = 2023`	改用范围查询
函数使用	`WHERE LOWER(name) = 'alice'`	存储转换值或使用函数索引
类型转换	`WHERE phone = 13800138000`（phone为varchar）	保持类型一致
OR条件	`WHERE age=18 OR name='Bob'`	拆分为UNION查询
LIKE模糊	`WHERE name LIKE '%son'`	避免前导通配符

3. 覆盖索引

-- 创建复合索引
CREATE INDEX idx_cover ON products (category, price);

-- 覆盖索引查询
SELECT category, price FROM products 
WHERE category = 'Electronics';  -- 无需回表

六、执行计划分析

EXPLAIN SELECT * FROM users WHERE age > 25;

字段	示例值	含义
type	ref	访问类型（性能排序：const > eq_ref > ref > range > index > ALL）
key	idx_age	实际使用索引
rows	100	预估扫描行数
Extra	Using index	覆盖索引标志

七、高级技巧

1. 索引下推（ICP）

-- 索引: (last_name, first_name)
SELECT * FROM employees 
WHERE last_name = 'Smith' 
AND first_name LIKE 'J%';

无ICP：先查所有Smith，再回表过滤
有ICP：直接在索引中过滤名以J开头

2. 前缀索引

-- 计算合适长度
SELECT 
  COUNT(DISTINCT LEFT(address, 10))/COUNT(*) AS sel10,
  COUNT(DISTINCT LEFT(address, 15))/COUNT(*) AS sel15
FROM users;

-- 创建索引
CREATE INDEX idx_address ON users (address(15));

八、设计最佳实践

选列原则：

高频出现在WHERE/JOIN/GROUP BY/ORDER BY的列
高区分度（Cardinality大）的列优先
避免为NULL值过多的列建索引

复合索引策略：

等值查询列在前，范围查询列在后
常用字段排序规则一致
单表索引数建议不超过5个

维护建议：

-- 定期优化
ALTER TABLE orders ENGINE=InnoDB; 
ANALYZE TABLE users;  -- 更新统计信息

九、实战案例

原始慢查询：

SELECT product_id, COUNT(*) 
FROM orders
WHERE status = 'completed'
  AND create_time BETWEEN '2023-01-01' AND '2023-12-31'
GROUP BY product_id
ORDER BY COUNT(*) DESC
LIMIT 10;

优化方案：

创建复合索引：

CREATE INDEX idx_order_stats ON orders 
(status, create_time, product_id);

二次优化（覆盖索引）：

SELECT product_id, COUNT(*) 
FROM orders USE INDEX (idx_order_stats)
WHERE status = 'completed'
  AND create_time BETWEEN '2023-01-01' AND '2023-12-31'
GROUP BY product_id;