小型机巡检流程
用户单位名称: 巡检日期: 年 月 日
设备概况
书写所含设备
1、检查系统硬件情况
设备故障灯是否有亮
2、系统错误报告
(errlog)
3、有否发给root用户的错误报告(mail)
4、检查log
hacmp.out,smit.log,boot.log
5、关键系统的文件使用率
不大于80%
6、逻辑卷有否stale
7、内存交换区使用率
是否超过70%
8、内存交换区的大小
是否为物理内存的1.5倍
9、检查备份情况
(有否系统备份、用户数据备份、磁带机是否需要清洗)
10、通信
(网卡、IP、路由表、ping、/etc/hosts、DNS设置等)
11、是否有数据保护方式
如RAID10/RAID5,是否有Hot spare
12、系统DUMP设置是否正确
13、检查系统参数是否正确
1)/etc/enviroment中的TZ不能有夏时制
2)如有数据库:Aio:available
3)HACMP中I/O pacing:High Water Mark/Low Water MArk:33/24
4)HACMP中Syncd:10
5)HACMP中Power Monitor:off
14、检查rootvg是否有镜象
15、检查errdemon,srcmstr是否正常运行
16、机房环境
(电压、湿度)
17、系统性能
有否性能瓶颈(topas,vmstat)
18、补丁程序(PTF)、微码(是否需要升级)
19、HACMP测试
Cluster Verification
20、系统硬件诊断
21、
运行#snap -ac,生成文件snap+s/n.pax.Z
22、其它设备
23机器清洁
本文详述了对小型机进行巡检的全面流程,包括检查系统硬件状况、错误报告、日志分析、资源使用率、逻辑卷状态、备份策略、通信验证、数据保护、系统参数设置、机房环境监控、性能评估、补丁与微码更新、集群验证、硬件诊断和系统快照等内容,确保系统稳定运行。

2505

被折叠的 条评论
为什么被折叠?



