数据库缓冲池（3）

原创于 2026-01-12 17:32:45 发布 · 1k 阅读

13 ·

本内容遵循CC 4.0 BY-SA版权协议

GEO检测

标签

#数据库

程序员必须知道的事儿专栏收录该内容

9 篇文章

订阅专栏

MySQL等数据库绝不会每次查询都去读磁盘。它们将热数据页（如索引、常用数据）缓存在内存的缓冲池中。将需要频繁访问的数据从磁盘（ms级）提升到内存（ns级），是系统性能飞跃的关键

一、缓冲池（Buffer Pool）核心概念

1.1 为什么需要缓冲池？

磁盘I/O瓶颈：机械硬盘随机读取延迟约10ms，SSD约0.1ms，而内存访问仅需100ns
性能提升：将数据从磁盘提升到内存，性能可提升100-1000倍
减少系统调用：避免频繁的磁盘I/O操作，降低系统开销

1.2 缓冲池工作原理

缓冲池是数据库在内存中开辟的一块区域，用于缓存从磁盘读取的数据页（Page）。当需要访问数据时：

首先在缓冲池中查找
如果命中（Buffer Hit），直接返回内存中的数据
如果未命中（Buffer Miss），从磁盘读取数据页到缓冲池，再返回

1.3 缓冲池存储内容详解

重要说明：缓冲池中既存储索引页，也存储数据页！

存储内容分类

缓冲池统一管理以下类型的页：

索引页（Index Pages）
- B+树的根节点和中间节点
- B+树的叶子节点（包含索引键值和指向数据页的指针）
- 哈希索引页
- 全文索引页等
数据页（Data Pages）
- 用户表的数据行
- 系统表的数据
- 临时表数据
系统页（System Pages）
- 数据字典页
- 元数据页
- Undo日志页
- 其他系统信息页

为什么两者都需要缓存？

索引页缓存的原因：

查询时需要通过索引定位数据，频繁访问的索引页会被保留在内存中
B+树遍历需要从根节点到叶子节点，缓存索引页减少I/O
索引页通常比数据页小，缓存成本低但收益高

数据页缓存的原因：

即使通过索引定位到数据页，仍需要读取数据页获取实际数据
频繁访问的热数据必须缓存，避免重复磁盘I/O
数据修改操作（INSERT/UPDATE/DELETE）需要在内存中进行

实际示例

假设执行查询：SELECT * FROM users WHERE id = 100

没有缓冲池的情况：

从磁盘读取索引根节点（1次I/O）
从磁盘读取索引中间节点（1次I/O）
从磁盘读取索引叶子节点（1次I/O）
从磁盘读取数据页（1次I/O）
总计：4次磁盘I/O

有缓冲池且全部命中的情况：

从缓冲池读取索引根节点（内存访问）
从缓冲池读取索引中间节点（内存访问）
从缓冲池读取索引叶子节点（内存访问）
从缓冲池读取数据页（内存访问）
总计：0次磁盘I/O，全部内存访问

各数据库的实际情况

MySQL InnoDB：

索引页和数据页共享同一个缓冲池
通过统一的LRU算法管理，不区分索引页和数据页
查看方法：

-- 查看缓冲池中索引页和数据页的分布
SELECT 
    TABLE_NAME,
    INDEX_NAME,
    SPACE,
    PAGE_NUMBER,
    PAGE_TYPE
FROM information_schema.INNODB_BUFFER_PAGE
WHERE PAGE_TYPE IN ('INDEX', 'INDEX')
LIMIT 100;

PostgreSQL：

索引页和数据页都存储在shared_buffers中
统一管理，不区分类型
查看方法：

-- 查看缓冲池中的页类型
SELECT 
    c.relname,
    CASE 
        WHEN c.relkind = 'r' THEN '数据表'
        WHEN c.relkind = 'i' THEN '索引'
        ELSE '其他'
    END AS 类型,
    count(*) AS 缓存页数
FROM pg_buffercache b
JOIN pg_class c ON b.relfilenode = c.relfilenode
GROUP BY c.relname, c.relkind;

Oracle：

索引块和数据块都存储在Buffer Cache中
统一管理，通过LRU算法淘汰
查看方法：

-- 查看缓冲池中的对象类型
SELECT 
    o.object_name,
    o.object_type,
    COUNT(*) AS cached_blocks
FROM V$BH bh
JOIN DBA_OBJECTS o ON bh.objd = o.object_id
GROUP BY o.object_name, o.object_type;

重要澄清：关于"常驻"的误解

❌ 错误理解：索引页常驻缓冲池，数据页不常驻

✅ 正确理解：索引页和数据页都不是"常驻"的，都会根据访问频率动态管理

关键点说明

没有"常驻"概念
- 缓冲池使用LRU、Clock等算法动态管理所有页
- 无论是索引页还是数据页，都会被淘汰
- 只有频繁访问的热数据才会长期保留
索引页也会被淘汰
- 如果某个索引长时间不被使用，其索引页会被淘汰出缓冲池
- 下次访问时需要重新从磁盘加载
- 例如：一个很少查询的表的索引，其索引页可能不在缓冲池中
数据页也会被淘汰
- 不常访问的数据页会被淘汰
- 例如：历史数据、归档数据等冷数据
只有热数据才会"长期保留"
- 频繁访问的索引页 → 长期保留
- 频繁访问的数据页 → 长期保留
- 不常访问的索引页 → 会被淘汰
- 不常访问的数据页 → 会被淘汰

实际场景示例

场景1：索引页被淘汰

1. 用户表users有一个索引idx_email，但最近3个月都没有查询使用
2. 缓冲池空间紧张时，idx_email的索引页被LRU算法淘汰
3. 某天突然查询 WHERE email = 'xxx'
4. 需要从磁盘重新加载idx_email的索引页到缓冲池

场景2：数据页被淘汰

1. 订单表orders中，2020年的历史订单数据很少被查询
2. 这些历史订单的数据页被淘汰出缓冲池
3. 查询历史订单时，需要从磁盘重新加载数据页

场景3：热数据长期保留

1. 用户表users的主键索引和最近3个月的数据频繁访问
2. 这些索引页和数据页一直在缓冲池的"热区"（New Sublist）
3. 即使缓冲池空间紧张，它们也不会被淘汰

查看缓冲池中的实际分布

MySQL InnoDB：

-- 查看哪些索引页在缓冲池中
SELECT 
    TABLE_NAME,
    INDEX_NAME,
    COUNT(*) AS cached_pages,
    SUM(IF(NUMBER_RECORDS > 0, 1, 0)) AS has_data
FROM information_schema.INNODB_BUFFER_PAGE
WHERE PAGE_TYPE = 'INDEX'
GROUP BY TABLE_NAME, INDEX_NAME
ORDER BY cached_pages DESC;

-- 查看哪些表的数据页在缓冲池中
SELECT 
    TABLE_NAME,
    COUNT(*) AS cached_data_pages
FROM information_schema.INNODB_BUFFER_PAGE
WHERE PAGE_TYPE = 'INDEX' 
  AND NUMBER_RECORDS > 0
GROUP BY TABLE_NAME
ORDER BY cached_data_pages DESC;

PostgreSQL：

-- 查看缓冲池中索引和表的分布
SELECT 
    CASE 
        WHEN c.relkind = 'r' THEN '数据表'
        WHEN c.relkind = 'i' THEN '索引'
    END AS 类型,
    c.relname AS 名称,
    COUNT(*) AS 缓存页数,
    COUNT(*) * 8 AS 缓存大小_KB
FROM pg_buffercache b
JOIN pg_class c ON b.relfilenode = c.relfilenode
WHERE c.relkind IN ('r', 'i')
GROUP BY c.relkind, c.relname
ORDER BY 缓存页数 DESC
LIMIT 20;

总结

✅ 索引页和数据页都会存储在缓冲池中
✅ 它们共享同一个缓冲池空间
✅ 通过统一的LRU等算法管理，不区分类型
✅ 两者都需要缓存才能实现最佳性能
⚠️ 重要：索引页和数据页都不是"常驻"的，都会根据访问频率被淘汰
⚠️ 只有频繁访问的热数据（无论是索引页还是数据页）才会长期保留

如果只缓存索引而不缓存数据，虽然能快速定位数据位置，但读取实际数据时仍需要磁盘I/O，性能提升有限。因此，完整的缓冲池策略必须同时缓存索引页和数据页。但需要明确的是，两者都不是"常驻"的，都是动态管理的。

二、主流数据库的缓冲池实现

2.1 MySQL InnoDB Buffer Pool

核心特性

默认大小：128MB（MySQL 5.7+），可通过 innodb_buffer_pool_size 配置
页大小：默认16KB（可通过 innodb_page_size 调整）
管理方式：使用改进的LRU（Least Recently Used）算法

数据结构

-- 查看缓冲池状态
SHOW ENGINE INNODB STATUS\G

-- 查看缓冲池配置
SHOW VARIABLES LIKE 'innodb_buffer_pool%';

热数据与冷数据分离

InnoDB采用分段LRU算法，将缓冲池分为两部分：

New Sublist（5/8）：存储最近访问的"热数据"
Old Sublist（3/8）：存储新加载的"冷数据"

工作流程：

新数据页首先进入Old Sublist的头部
如果在Old Sublist中访问超过innodb_old_blocks_time（默认1秒），则提升到New Sublist
如果Old Sublist中的数据长时间未访问，会被淘汰

索引缓存策略

B+树索引：索引页和数据页都缓存在缓冲池中
自适应哈希索引：InnoDB会自动为频繁访问的索引页创建哈希索引，加速查找
Change Buffer：缓存对非唯一索引的更新操作，减少随机I/O

预读机制（Read-Ahead）

线性预读：当顺序访问某个区（Extent，64个页）的56个页时，触发异步预读下一个区
随机预读：当缓冲池中某个区的13个连续页都被访问时，异步预读该区的剩余页

2.2 PostgreSQL Shared Buffers

核心特性

默认大小：128MB，通过 shared_buffers 配置
页大小：固定8KB
管理方式：使用时钟扫描算法（Clock Sweep Algorithm）

缓冲池结构

-- 查看缓冲池使用情况
SELECT * FROM pg_buffercache;

-- 查看缓冲池配置
SHOW shared_buffers;

热数据管理（Clock算法详解）

PostgreSQL使用改进的Clock算法管理缓冲池：

核心机制：

环形缓冲区：所有缓冲页排列成环形，时钟指针顺时针扫描
使用位（Reference Bit）：每个页有使用位，访问时设置为1，扫描时清除为0
脏位（Dirty Bit）：标记页是否被修改，脏页需要先刷盘才能淘汰
二次机会：使用位=1的页给一次机会（清除使用位），使用位=0的页直接淘汰

工作流程：

页被访问时，设置使用位=1
需要淘汰页时，时钟指针开始扫描
遇到使用位=1的页：清除使用位，继续扫描
遇到使用位=0的页：如果干净则直接淘汰，如果脏则先刷盘再淘汰

后台优化：

bgwriter进程：后台定期扫描，提前清理不常用的页
分区管理：减少锁竞争，提高并发性能
自适应扫描：根据缓冲池使用率调整扫描频率

索引缓存

索引页缓存：B-tree、Hash、GiST等索引页都缓存在shared_buffers中
系统缓存：PostgreSQL还依赖操作系统的页缓存（Page Cache）作为二级缓存

2.3 Oracle Database Buffer Cache

核心特性

SGA（System Global Area）：包含Buffer Cache、Shared Pool等
页大小：通常为8KB（可通过DB_BLOCK_SIZE配置）
管理方式：使用LRU算法，分为Hot和Cold区域

缓冲池分类

Oracle提供三种缓冲池：

Default Buffer Pool：默认缓冲池，使用LRU算法
Keep Buffer Pool：保留池，用于缓存频繁访问的小表
Recycle Buffer Pool：回收池，用于缓存大表的一次性访问

-- 查看缓冲池配置
SELECT * FROM V$BUFFER_POOL;

-- 查看缓冲池命中率
SELECT * FROM V$SYSSTAT WHERE name LIKE '%buffer%';

热数据识别

Touch Count：记录数据块被访问的次数
检查点（Checkpoint）：定期将脏页写入磁盘
DBWR进程：数据库写入进程，负责将脏页刷盘

2.4 SQL Server Buffer Pool

核心特性

默认大小：动态分配，可通过 max server memory 限制
页大小：8KB
管理方式：使用LRU-K算法（K=2）

缓冲池管理

-- 查看缓冲池使用情况
SELECT * FROM sys.dm_os_buffer_descriptors;

-- 查看缓冲池命中率
SELECT 
    (1 - (physical_reads / (page_reads + page_writes))) * 100 AS BufferCacheHitRatio
FROM sys.dm_os_performance_counters;

热数据策略

Free List：维护空闲页列表
Hash Buckets：通过哈希表快速定位数据页
Lazy Writer：后台进程定期清理不常用的页

三、热数据处理机制详解

3.1 什么是热数据？

热数据（Hot Data）是指：

访问频率高：短时间内被多次访问
访问模式稳定：访问模式可预测
对性能影响大：缓存命中率直接影响查询性能

3.2 热数据识别算法

LRU（Least Recently Used）

原理：最近最少使用的数据被淘汰
实现：使用双向链表，访问时移到头部
优点：简单高效
缺点：对全表扫描等操作敏感

LRU-K算法

原理：记录最近K次访问时间，淘汰最久未访问的数据
优点：能更好地区分热数据和冷数据
应用：SQL Server使用LRU-2

Clock算法（时钟扫描）

Clock算法（Clock Sweep Algorithm），也称为二次机会算法（Second Chance Algorithm），是一种近似LRU的页面替换算法。

算法原理

Clock算法使用环形缓冲区和时钟指针来模拟LRU，但实现更简单，开销更小。

核心数据结构：

环形缓冲区：所有缓冲页排列成环形链表
时钟指针（Clock Hand）：指向当前扫描位置，顺时针移动
使用位（Reference Bit / Usage Bit）：每个页有一个标志位，表示最近是否被访问
脏位（Dirty Bit）：标记页是否被修改过

工作流程

基本Clock算法（单使用位）：

初始化：所有页的使用位初始化为0
页访问：当页被访问时，设置使用位为1
页淘汰：需要淘汰页时，时钟指针开始扫描：
- 如果当前页使用位=0：直接淘汰（未使用）
- 如果当前页使用位=1：给一次机会，清除使用位（设为0），指针继续移动
- 重复直到找到使用位=0的页

示例流程：

假设有4个缓冲页，当前状态：
页A: 使用位=1, 脏位=0
页B: 使用位=0, 脏位=0
页C: 使用位=1, 脏位=1
页D: 使用位=1, 脏位=0
时钟指针指向页A

需要淘汰页时：
1. 检查页A：使用位=1 → 清除为0，指针移到页B
2. 检查页B：使用位=0 → 淘汰页B ✓

PostgreSQL的改进Clock算法

PostgreSQL使用改进的Clock算法，增加了更多优化：

1. 多级使用位

不仅记录是否访问，还记录访问频率
使用多个位来区分热数据和冷数据

2. 脏页处理

优先淘汰干净页（未修改的页）
脏页需要先刷盘才能淘汰，成本更高

3. 后台扫描

后台进程定期扫描，提前清理不常用的页
避免在需要时临时扫描造成的延迟

4. 分区管理

将缓冲池分成多个分区，减少锁竞争
每个分区独立使用Clock算法

算法伪代码

class ClockAlgorithm:
    def __init__(self, buffer_pages):
        self.pages = buffer_pages  # 环形缓冲区
        self.clock_hand = 0        # 时钟指针
        self.page_size = len(buffer_pages)
    
    def access_page(self, page_id):
        """访问页时设置使用位"""
        page = self.find_page(page_id)
        if page:
            page.reference_bit = 1  # 设置使用位
    
    def evict_page(self):
        """淘汰页"""
        while True:
            current_page = self.pages[self.clock_hand]
            
            if current_page.reference_bit == 0:
                # 找到可淘汰的页
                if current_page.dirty_bit == 1:
                    # 脏页需要先刷盘
                    self.flush_to_disk(current_page)
                
                evicted_page = current_page
                self.clock_hand = (self.clock_hand + 1) % self.page_size
                return evicted_page
            else:
                # 给一次机会，清除使用位
                current_page.reference_bit = 0
                self.clock_hand = (self.clock_hand + 1) % self.page_size

与LRU算法的对比

特性	LRU算法	Clock算法
时间复杂度	O(1)访问，O(n)淘汰	O(1)访问，O(n)最坏淘汰
空间开销	需要双向链表	只需使用位（1-2位）
实现复杂度	较复杂（需要链表操作）	简单（只需位操作）
精确度	精确LRU	近似LRU
锁开销	需要保护链表操作	只需保护位操作，开销小
适用场景	小规模缓存	大规模缓存（如数据库缓冲池）

优缺点分析

优点：

实现简单：不需要维护复杂的链表结构
空间效率高：每个页只需1-2个位，而LRU需要指针
锁竞争少：位操作比链表操作更快，减少锁持有时间
适合大规模：当缓冲池很大时，Clock算法比LRU更高效
近似LRU效果：虽然不精确，但实际效果接近LRU

缺点：

不是精确LRU：可能淘汰最近访问的页（如果使用位被清除）
扫描开销：最坏情况下需要扫描整个缓冲池
参数敏感：需要合理设置扫描策略和脏页处理

PostgreSQL中的实际应用

配置参数：

-- 查看缓冲池配置
SHOW shared_buffers;

-- 查看后台写入进程配置
SHOW bgwriter_delay;          -- 后台写入延迟（默认200ms）
SHOW bgwriter_lru_maxpages;   -- 每次扫描最多写入的页数
SHOW bgwriter_lru_multiplier; -- LRU扫描倍数

监控命令：

-- 查看缓冲池统计
SELECT * FROM pg_stat_bgwriter;

-- 关键指标：
-- buffers_alloc: 分配的缓冲页数
-- buffers_backend: 后端进程分配的页数
-- buffers_backend_fsync: 后端进程同步的页数
-- buffers_checkpoint: 检查点写入的页数
-- buffers_clean: 后台写入进程清理的页数
-- buffers_checkpoint: 检查点写入的页数

工作流程：

正常访问：查询访问页时，设置使用位
后台扫描：bgwriter进程定期扫描，清理使用位=0的页
需要空间时：如果缓冲池满，立即扫描找到可淘汰的页
脏页处理：脏页先由bgwriter或checkpoint进程刷盘，再淘汰

实际示例

场景：PostgreSQL缓冲池管理

-- 假设缓冲池有1000个页，当前状态：
-- 页1-100: 使用位=1（最近访问）
-- 页101-500: 使用位=0（未使用）
-- 页501-600: 使用位=1（最近访问）
-- 页601-1000: 使用位=0（未使用）
-- 时钟指针在页1

-- 需要分配新页时：
-- 1. 检查页1：使用位=1 → 清除为0，指针移到页2
-- 2. 检查页2：使用位=1 → 清除为0，指针移到页3
-- ...
-- 101. 检查页101：使用位=0 → 淘汰页101 ✓

-- 如果页101是脏页：
-- 1. 先刷盘（写入磁盘）
-- 2. 再淘汰

优化策略

1. 多级Clock算法

使用多个使用位（如2位），记录访问频率
更精确地区分热数据和冷数据

2. 自适应扫描

根据缓冲池使用率调整扫描频率
使用率高时增加扫描频率

3. 预清理

后台进程提前清理不常用的页
避免在需要时临时扫描

4. 分区管理

将缓冲池分成多个分区
每个分区独立使用Clock算法，减少锁竞争

总结

Clock算法是LRU算法的近似实现，通过简单的位操作和环形扫描，实现了接近LRU的效果，但实现更简单、开销更小。特别适合大规模缓冲池的场景，如PostgreSQL的shared_buffers。

核心思想：给每个页一次"第二次机会"，如果最近访问过就保留，否则淘汰。通过时钟指针的循环扫描，实现了近似LRU的页面替换策略。

3.3 热数据提升策略

访问计数：记录数据页的访问次数
时间窗口：在指定时间窗口内的访问才计入
提升阈值：达到阈值后从冷区提升到热区
降级机制：热区数据长时间未访问会降级到冷区

四、索引缓存策略

4.1 索引页缓存

B+树索引缓存

根节点和中间节点：优先缓存，减少树遍历深度
叶子节点：根据访问频率缓存
索引页大小：通常与数据页相同（MySQL 16KB，PostgreSQL 8KB）

索引预加载

启动时加载：数据库启动时可预加载常用索引
按需加载：查询时按需加载索引页
预读优化：顺序访问索引时触发预读

4.2 自适应索引

MySQL自适应哈希索引（Adaptive Hash Index, AHI）

作用：在热点B+树叶子页上自动建立哈希映射，将等值查找从“树遍历”降为“哈希查找”，命中时可跳过B+树搜索。
触发条件（简化理解）：同一个索引的同一前缀被频繁执行等值或左前缀等值查找，访问次数超过内部阈值；不对范围/模糊查询建立哈希。
适用/不适用：
- 适用：=、IN、左前缀等值（如 WHERE email='x'、WHERE (a,b)=(1,2)）且访问集中在少量叶子页。
- 不适用：范围查询（>,<,BETWEEN）、模糊匹配（LIKE '%x'）、低选择性或全表扫描。
内存占用：AHI占用Buffer Pool空间，构建/维护也消耗CPU；如果命中率低，收益不抵成本。
并发影响：全局哈希表有分区锁（innodb_adaptive_hash_index_parts，默认8分区），高并发且热点集中时可能出现Latch争用。
开关与配置：
- 打开/关闭（动态）：SET GLOBAL innodb_adaptive_hash_index = ON|OFF;
- 分区数：innodb_adaptive_hash_index_parts（减少热点锁竞争，需重启）
监控：
- SHOW ENGINE INNODB STATUS\G 中的 Adaptive hash index 段
- performance_schema/information_schema.INNODB_METRICS 中的 adaptive_hash_* 统计
调优建议：
- 默认保持开启，先观察是否有Latch争用或内存压力。
- 如果观察到 hash searches/s, hash_adaptive_hash_mutex_waits 等指标过高，或CPU在自旋上消耗明显，可关闭再评估。
- 访问模式以范围/扫描为主且等值命中少时，关闭可能更省资源。

Oracle索引组织表（IOT）

表即索引：数据直接存储在索引结构中
缓存优势：索引和数据一起缓存，减少I/O

4.3 索引缓存优化

索引选择性：高选择性索引优先缓存
索引使用统计：根据使用频率决定缓存优先级
复合索引优化：合理设计复合索引，减少索引页数量

五、常见数据缓存管理

5.1 数据页缓存

缓存优先级

系统表：数据字典、元数据表（最高优先级）
索引页：B+树索引节点
数据页：用户表数据
临时数据：临时表、排序缓冲区

缓存策略

写时复制（Copy-on-Write）：修改数据时创建副本
脏页管理：修改过的页标记为脏页，定期刷盘
检查点机制：定期将脏页同步到磁盘

5.2 查询结果缓存

MySQL Query Cache（已废弃）

问题：表更新时整个缓存失效，性能问题严重
替代方案：应用层缓存（Redis、Memcached）

PostgreSQL查询计划缓存

计划缓存：缓存查询执行计划
参数化查询：使用参数化查询提高计划复用率

5.3 系统元数据缓存

数据字典缓存

表结构信息：表定义、列信息、索引信息
统计信息：表大小、行数、索引统计
权限信息：用户权限、角色信息

缓存更新机制

DDL操作：表结构变更时更新缓存
统计信息更新：定期或手动更新统计信息
失效机制：相关操作时自动失效缓存

六、缓冲池优化实践

6.1 缓冲池大小配置

MySQL InnoDB

-- 建议设置为物理内存的50-70%
SET GLOBAL innodb_buffer_pool_size = 8589934592; -- 8GB

-- 查看当前配置
SHOW VARIABLES LIKE 'innodb_buffer_pool_size';

PostgreSQL

-- 建议设置为物理内存的25%
ALTER SYSTEM SET shared_buffers = '2GB';

-- 重启生效
SELECT pg_reload_conf();

6.2 监控缓冲池性能

关键指标

缓冲池命中率：应保持在95%以上

-- MySQL
SHOW GLOBAL STATUS LIKE 'Innodb_buffer_pool_read%';

-- 命中率 = (1 - Innodb_buffer_pool_reads / Innodb_buffer_pool_read_requests) * 100

脏页比例：监控脏页数量，避免过多脏页影响性能
预读效率：监控预读命中率，调整预读参数

6.3 常见优化技巧

合理设置缓冲池大小：避免过大导致操作系统内存不足
监控命中率：定期检查缓冲池命中率
优化查询：减少全表扫描，使用索引
预热缓冲池：数据库重启后，执行常用查询预热缓冲池
分离热冷数据：使用分区表，将热数据和冷数据分离

七、缓冲池与操作系统缓存

7.1 双重缓存机制

大多数数据库系统存在双重缓存：

数据库缓冲池：数据库自己管理的缓存
操作系统页缓存（Page Cache）：操作系统管理的文件系统缓存

7.2 缓存协调

直接I/O（Direct I/O）：绕过操作系统缓存，直接访问磁盘
缓冲I/O（Buffered I/O）：使用操作系统缓存
最佳实践：数据库缓冲池 + 操作系统缓存，但需要合理配置避免重复缓存

八、总结

数据库缓冲池是数据库性能的核心组件，通过将热数据、索引和常用数据缓存在内存中，实现了从磁盘到内存的性能飞跃。不同数据库虽然实现细节不同，但核心思想一致：

热数据优先：频繁访问的数据优先保留在内存中
智能淘汰：使用LRU等算法淘汰不常用的数据
预读优化：预测性加载可能访问的数据
写缓冲：延迟写入，批量刷盘

合理配置和优化缓冲池，可以显著提升数据库性能，减少磁盘I/O，提高系统整体响应速度。