有个11204 rac的测试环境,客户反馈凌晨rman全备时偶尔会有内存耗尽导致数据库重启的情况,不是合同内的维护环境,请我们帮忙处理。我估计是没配置vm.min_free_kbytes,之前也调整多次每次都成功完成,就没有多想,直接白天调整了

机器内存有370G多, 实例sga+pga=260G,我计划配置成预留50G
添加如下配置后,sysctl -p执行生效
vm.min_free_kbytes = 52428800
几分钟后发现db1不正常了,oraagent .bin负载高了,db1上无法执行查询命令crsctl status res -t

查看集群日志
2023-06-16 15:14:03.998:
[ohasd(9796)]CRS-2878:Failed to restart resource 'ora.gpnpd'
2023-06-16 15:14:04.056:
[ohasd(9796)]CRS-2878:Failed to restart resource 'ora.mdnsd'
2023-06-16 15:14:07.504:
[gpnpd(15816)]CRS-2328:GPNPD started on node db1.
2023-06-16 15:14:10.523:
[gpnpd(15816)]CRS-2338:Clusterwide GPnP profile updates may be impaired.
2023-06-16 1

在11204rac的测试环境中,客户反馈rman全备份时遇到内存耗尽导致数据库重启的问题。技术人员尝试调整vm.min_free_kbytes设置为50G,但随后发现导致了oraagent.bin负载升高,db1上查询命令无法执行,以及一系列与GPNPd和DNS-SD相关的错误。系统出现内存不足的报错,最终通过主机重启恢复服务。这是一个关于操作系统内核内存管理和Oracle集群资源管理的故障案例。

1774

被折叠的 条评论
为什么被折叠?



