前面我们了解到PostgreSQL的故障恢复与checkpoint、WAL密切有关。当数据库异常宕机,通过顺序的重放WAL段文件中从重做点(REDO point)开始的XLOG记录来进行数据库的恢复操作。
恢复流程
关于数据库的恢复过程,首先是在数据库启动的时候加载pg_control文件,通过pg_control文件中的State及Latest CheckPoint信息来决定是否需要重放以及从什么位置开始重放。

具体步骤描述如下:
- PG数据库在启动的时候读取pg_control文件。如果State的值是’in production’,PG就会进入恢复模式,因为这个状态表示上一次是异常关闭;如果State的值是’shut down’,PG就会进行正常的启动模式。
- PG读取pg_control文件中的Latest CheckPoint,Latest CheckPoint指定WAL段文件的地址,并以此获得重做点信息。如果Latest CheckPoint不可用,就会读Prior CheckPoint,如果两个重做点都不可用,就会放弃恢复过程。(在PG 11版本开始已经废弃Prior CheckPoint)
- 相应的资源管理器从重做点开始有序读取并重放XLOG记录,一直到WAL日志中的最新日志点。如果XLOG记录重放且是一个备份块,不需要考虑当前LSN直接重写对应表的页面。相反,如果是一个非备份块的XLOG,只有当记录的LSN比对应表页面中的pg_lsn大,才会进行重放。
为什么需要对比LSN与页面中的pg_lsn
上述简单描述了数据库恢复的过程,那么对于非备份块,为什么需要对比LSN及对应页面的pd_lsn呢?
首先我们还是先看一下插入过程。


4万+

被折叠的 条评论
为什么被折叠?



