ITPub博客

首页 > Linux操作系统 > Linux操作系统 > AIX巡检方法

AIX巡检方法

原创 Linux操作系统 作者:baizhaoxian 时间:2008-11-04 15:26:25 0 删除 编辑

1、  机房环境检查

零地电压是否小于1V

温度(摄氏 ℃)

10 40

湿度(%

8% 80%

电源线的母头是否为左零右火电压值是否为240V

2、  查看硬件情况

检查设备故障灯,一般为橙色并有故障标志。

有没有异常声响,如硬盘、风扇等。

有没有破损的电缆等

3、  主机检查

        1)系统空间使用情况,文件系统是否有“满”。命令:df –k

2)查看卷组信息,有没有"stale"状态的逻辑卷  命令:lsvg -l rootvg

        3)检查内存交换区(paging space)使用率是否超过70% 命令:# lsps –s

                                                              #lsps a

                                          观察内存大小的命令:lsattr El mem0

                                                        命令:vmstat 2 5

           显示从系统启动到现在使用fork(创建的进程)的数量  命令:vmstat - f

        4)当前操作系统版本                       命令 oslevel

5系统性能检查:

a) CPU性能:        使用Vmstat, topas来检查

b) 内存使用情况:也是使用topas, vmstat来检查

c) 检查IO平衡使用情况:使用iostat来检查

d) 交换空间使用情况:   使用lsps –a来检查

        6)网络检查

                  netstat -i 查看网卡状态

                  Ierrs/Ipkts Oerrs/Opkts是否>1%

                  ping host_name /IP Address  查看是否通和是否有丢包。

                  路由表#netstat -rn  查看路由表是否正确,ping 各路由器是否通

 

    核对主机名: #hostname

    #ifconfig -a

                  #lsattr –El inet0

        7)检查dump设置

                     #sysdumpdev –l

8检查系统合法/非法登陆情况

使用Last命令来检查来自登陆的地方。

9) 检查系统是否有巨大的Core文件生成

使用 find / -name core print来检查。对Core文件,一般直接删除。

        10)网卡的状态、IP地址、路由表等           命令:netstat –in

                                                   查看   /etc/hosts

        11)列出系统中已安装的网络适配器           命令:#lsdev -Cc adapter

                    列出系统中已配置的网络接口     命令:#lsdev -Cc if

        12) snap -a来搜索AIX系统的大部分配置信息  

        13) 查看错误报告                           命令: errptssa_ela errpt |more

errpt -a >/tmp/errpt_20071111.txt  //将错误导出  errpt -a > errptlog.txt

errpt 查看aix的错误日志

errpt -dH    //硬件故障

errpt -dS    //软件故障 

errpt –a | pg   //获得所有错误日志的详细报告   

        14)有否发给root用户的错误报告(mail)   

        15)查看系统信息                   命令:lsconf |more

                                                 lsdev -Cc processor

lsattr -El procX

prtconf |more

bindprocessor -q 

        16)检查hacmp.out,smit.log,boot.log       命令:

lssrc -g cluster  看一下 hacmp.out      命令:tail -f /tmp/hacmp.out

tmp里面查看有无smit.log,用vi查看

boot.log 查看:# alog -o -t boot

        17)查看卷组信息,有没有"stale"状态的逻辑卷  命令:lsvg -l rootvg

        18)使用iostat命令监控I/O                   命令:iostat 1 2

        19)查看系统定时备份情况                     命令:crontab –l   

        20)HACMP

                 检查Cluster是否运行正常

                 Cluster进程是否运行:#lssrc –g cluster,至少两个进程,且为active

                 IP地址是否获取:#netstat –i,看boot IP是否变为service ip

                 VG是否varyon#lsvg o

                 文件系统是否mount#mount

       应用进程是否启动:#ps ef | grep app_name

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/14136468/viewspace-485671/,如需转载,请注明出处,否则将追究法律责任。

请登录后发表评论 登录
全部评论

注册时间:2008-10-23

  • 博文量
    29
  • 访问量
    122985