ITPub博客

首页 > Linux操作系统 > Linux操作系统 > 转:AIX菜鸟成长日志

转:AIX菜鸟成长日志

原创 Linux操作系统 作者:lenx2000 时间:2009-08-03 17:31:37 0 删除 编辑

一、机器巡检基本知识


巡检一般又厂商或者代理商来做。
第一:首先是机房温度以及湿度的检查,当然这些一般情况都没问题。
         参考值:温度(摄氏         10 40
                     湿度                           8% 80%
第二:就是关于电源的检测,这个只要不是新装机,一般没问题。
        参考值: 零-地电压        小于1V
                     -地电压        200-240V
        补充:当然59系列的机器相间380V,相地240V
第三:关于报错。
         主要查看硬件的永久性报错   #errpt -dH | pg
             软件的永久性报错   #errpt -dS | pg
         还有系统又没又报警灯(如果不正常,在后面的帖子将会细讲)
第三:机器的序列号:#uname -Mu
第四:操作系统版本:#oslevel -r      注:又时候不能使用是因为系统版本低的原因
第五:其他检测

执行sysdumpdev –l 检查dump是否设置为always allow sysdump
执行sysdumpdev –e检查当前dump大小应该为主dump设备的大小的80%以下
执行lsvg -l rootvg检查有否"stale"状态的逻辑卷
执行lsps -s检查内存交换区占用情况
执行df –k检查文件系统的分配状况,一般不要超过80%
执行lsdev –Ccdisk检查硬盘状态为available
执行lsdev –Ccadapter检查PCI卡状态为available
执行lsdev –Cctape检查磁带机状态为available
执行lsdev – Ccprocessor检查CPU状态为available
执行 lsattr –El sys0|grep autorestart  检查系统crash后是否自动重新启动 
执行lsattr –El sys0|grep cpuguard检查CPU GUARD是否开启
执行lsattr –El mem0检查内存状态正常size=goodsize
执行 vmstat 2 
iostat,topas观察us,sy,pi,po,内存占用率,硬盘读写速度等检查是否有性能瓶颈
执行netstat –innetstat –rn观察网络状态
执行entstat –d enX检测网卡运行速率与交换机速率是否匹配(网卡速率由10M半工改为自适应时,缺省网关会丢失。更改网卡速率后需要在系统中执行smitty route操作重新激活缺省路由。如果进行网卡速率的调整,请务必小心。)
执行ping命令检查网络连接状况
执行lsdev –C|grep aio 检查异步IO是否可用
执行lssrc –g cluster查看是否有三个进程均为active状态(这个主要看起了几个HA的进程了,有的时候是一个或两个)
执行/usr/sbin/cluster/clstat –a查看cluster状态是否正常
检查/etc/hosts确保双机配置中IP别名不会存在包含关系(share_ip1包含了share_ip
执行
more /usr/es/adm/cluster.log
more /usr/es/sbin/cluster/history/*
cat /tmp/hacmp.out
检查这三个日志中是否有error或者fail.
检查7133面板上的指示灯,如果黄灯亮则需要诊断问题
HOTspare 磁盘检测
1、检查是否有raid保护 # smitty ssaraid--->List All Defined SSA RAID Arrays
2、检查是否有Hot Spare # smitty ssaraid--->List Components in a Hot Spare Pool
 List All Defined SSA RAID Arrays查看7133à对于7133,执行Smitty ssaraid raid状态,正常应该为good状态。
Change/Show Use of an SSAà对于7133,执行Smitty ssaraid Physical Disk查看7133硬盘状态,正常应该为member或者spare状态
对于FastT,分别登录上两个controller (登陆方法后面详细讲解),查看是否有错误日志。
记录检查结果

基本就是这些命令吧,如果我有遗漏后面继续补充。

对了,如果是华为和IBM的联合巡检就会多出几个项目:

cpu (主频*数量)    #lsattr -El proc0
内置磁盘个数:  #lsdev -Ccdisk     
网卡信息:        #lsdev -Ccadapter
-------------------------------------------------------------------------------------------------------------

二、DS8300 硬盘更换 

当前状况:DS8300硬盘损坏

首先要在HMC上查看具体的报错信息,一般会有多个,先看最早的,因为一般可能几个错误报的都是同一个硬盘的错误。
在报错中我们可以看见报错的Location Code,上面一般都是U****-D*-P*-T* 还有笼子号
顺着这个号找到错误的硬盘,DS83003个机柜,里面有控制台和两台570的是主柜,一般编号是D0,顺着就是D1\D2
每个笼子有16块硬盘,找到笼子以后按T后面的数字数就行了,这个是前话,因为这个时候你还不能把盘。

现在你在报错信息上面右键 Repair,(后面的步骤必须看清楚系统提示)然后弹出一个确认,你next,它就会提示说要切断该硬盘的电源,然后的界面不要急着NEXT,应该这里提示你更换后NEXT,这个时候也会弹出一个系统的帮助文件

现在你就可以拔硬盘了,正确的方法就是将卡扣拉松后等待70秒,然后硬盘角度微向上将硬盘慢慢抽出,这样可以避免将盘底部的电路划伤,在弹出的HELP上有图示。

然后插入新的硬盘,现在点NEXT,后面的基本就是漫长的等待了,大概2个小时左右会告诉你数据将会重建,如果有问题会CALL HOME等信息,关了走人就可以了,后面失败的几率很小了。

这个就是DS8300的换盘步骤,希望有错误请老鸟们提出,我好改正。

三、630机器升级微码



这次是要将一台630微码升级到07045这个版本。
首先下载微码了,这个不用说了,到IBM的网站上一步一步找就可以了。
下载完是一个70286C4F.BIN 的文件

然后在机器的  /tmp目录下新建 目录 /fwupdate  ,如果存在这个目录就一定要清空里面的内容,然后 把70286C4F.BIN 上传到这个目录。

Ftp的命令都会哈:
ftp
open ***.***.***.***
user/password
prompt          关回显
bin                二进制
lcd F:/
cd /tmp/fwupdate
mput 70286C4F.BIN
bye
-----------------------------------------------------------
升级前需要注意几个问题:
1.系统必须升级到5103版本以后
2.HMC的版本必须是3.12 或更高,我这里用KVM,所有不管这个事情

现在要确认客户已经停了所有业务,并且有除rootvg外其他的VG都没已经umount下去了。

确认OK,如下:
#cd /tmp/fwupdate
#chmod +x 70286C4F.BIN           加上执行权限

#./70286C4F.BIN            解压缩
解压缩后会出来一个文件 3R070425.img
然后最好校验一下这个文件
#sum 3R070425.img
对比微码给出的校验值,这个最好还是要做,我们一个老大经常教导我们:警钟长鸣,事故为零
这个的校验码好像是47728,详细的自己再查一下,以网站上的为准

校验没问题,现在就开始升微码

#cd /usr/lpp/diagnostics/bin
#./update_flash –f /tmp/fwupdate/3R070425.img

这个两个命令下去,机器重新启动,要大概半个小时,启动后就是新的微码了。

启动后:
#lsmcode –c
那么
Platform firmware level is 3R070425

四、DS4700更换硬盘


首先谢谢各位的支持了。
今天继续.......
今天客户的一台DS4700一个硬盘挂了,拿到备件后就到现场了。

先打开本本,然后找到那台出问题的DS4700,然后连到控制器A上。
这里我细说一下,DS4700后面左面的是控制器A,右边的是控制器B
每个控制器有两个电口,右边的为1号,左边为2号。IP地址如下:

控制器A--1 左口默认IP地址:  192.168.129 .101
控制器A--1 右口默认IP地址:  192.168.128 .101


控制器B--1 左口默认IP地址:  192.168.128 .102
控制器B--1 右口默认IP地址:  192.168.129 .102

我连了控制器A的右口,然后配置IP地址为192.168.128 .102,掩码为255.255.255.0

ping 192.168.128 .101 ,PING 的通的话打开Storage Manager Client
可以直接让它自动检测,检测不到的话你输入192.168.128 .101就连上了

然后先点上面的听诊器图标,这里报了两个错误,一个是PowerSupply的,另一个是Disk Failed
硬盘挂了是今天的主题,但是出了个电源的报错,先处理下
仔细看了一下说冗余电源没有连通什么什么的,仔细检查了下发现冗余电源的开关没打开,将开关按下,冗余电源点亮了,重新看出错,只剩下硬盘的。

这里多说一句,做任何操作最好严格的按照ServiceGuide一步一步来,不要急,尤其是搞硬盘这些,乱搞是会出问题的。
现在从SM里面先看看情况,明显的看到Slot 13上的硬盘已经是Failed的状态了,一个红色的叉,这个时候你千万要看清楚Hotspare盘是不是已经成功接管了,鼠标放到一个全灰底部有十字的盘上看看是不是写了已经是In Use状态,并且接管的是Slot13的盘,当这一切确认后,开始换盘。

先仔细确认坏盘的位置(有黄色警示灯的,这个拔错了就没法说你了)
先把手在机架上随便摸摸,或者带上机架上的防静电手腕
把卡扣拉松,等待70秒,然后把坏盘小心抽出,再等待70秒插入新盘,推紧,然后推上卡扣。

这个过程中不要断开你的SM软件,这个时候你看SMSlot13上的那个盘上面会出现一个旋风的图案,那是盘开始Building了,等待大概2个小时左右,等这个盘的状态变成了和其他盘状态一样就可以了。这个时候Hotspare盘会恢复为空闲状态。

整个过程就完了。

五、IBM SVC 的基本安装步骤


SVC我还是先简单介绍一下吧,因为今天我也是第一次接触这个东西。

SVC通俗的理解可以认为是一个统一的容灾平台,就是可以把各个厂家的存储产品虚拟成IBM存储管理格式进行统一管理。SVC有一种Image mode运行模式,可以透明的加入SAN SVC的基本功能,当SVC被加入到一个现有的SAN 环境中时,不需要做数据迁移,SVC 把现有的磁盘配置原封不动的继承下来(这是SAN VCImage mode),这样对服务器上的应用是完全透明的。

摘抄一段专业点的解释:
    – 高扩展性,可以多结点cluster结构并行扩展
    – 高开放性,支持所有主流的存储和主机
    – 独立性,位于中间层,不占用主机的CPU和存储资源
    – 高性能,IBM SVC目前具有业界第一的SPC-1测试性能,具有单独的处理器和CACHE帮助存储分担压力
    – 出色的功能,SVC具有统一的容灾和虚拟存储的功能等,是不同存储具有相同功能。
    – 集中管理,为用户提供统一的存储管理接口,不同存储平台可以统一管理

因为今天我的任务上架并调试OK,具体的配置慢慢来掌握吧。
现在客户这里是两套SVC,具体的组件有这些,一个X机的服务器,一套显示屏+鼠标键盘,两个UPS电池,两个SVC服务器。

上架没什么说的 ,我的方式就是,最下面是两个1UUPSUPS间空了一个U保证散热,然后装上管理的服务器和显示屏,最上面装两个SVC。对了,有一点就是UPS上架前需要把前面板拆下,然后把电源线接上,接的时候会蹦出火花,是正常的,我当时接的时候吓出一身冷汗 ,赶紧看ServiceGuide,上面说这是正常的,我才松了一口气。


上架完了就比较重要了,这里有些讲究,SVC要最后上电!!!
步骤如下:
1.先连接控制台服务器和显示屏还有鼠标键盘
2.然后两个SVC与两个UPS分别用带的一个双头线连起来(每端一个视频接口一个电源接口)
3.将每个SVC的电口和控制台的电口接到一个交换机上!
4.分别将两台SVC13光纤口接入一台SAN交换机,另外的24口接入另一台SAN交换机。

这样准备工作就基本完了,注意:你如果没做34步骤直接点SVC那么会提示出错的,后面再调很麻烦。

现在给UPS加电,理论上UPS加电后会充电3个小时才能起SVC,但是一般都是充好的,你点上个几分钟就看到绿灯正常了。
现在起控制台,控制台是装的Windows2003,一般不会有什么问题,直接就进系统了。
现在要起SVC了,确认上面34步骤已经完成。点亮SVC后,几分钟后如果正常就会在前面板上显示"Cluster"字样,这样整个安装就完成了。

接下的就是添加节点和IP地址什么的了,都是在SVC的面板上完成,但是到现在为止我的工作就完成了,遗憾的是后面的安装没机会参加,也不太清楚了!

SVC目前的应用并不是很多,所有先写这些让大家了解一下,如果那位有更详细的安装经验,请共享吧!

六、DS4300控制器电池的更换


先对关注的朋友们说声抱歉,很久没更新了,年前前后实在太忙了,没有整块的时间来整理笔记,现在继续吧。

下午是到一个客户现场更换一个Ds4300的控制器的电池,当然也叫FAStT600。这个是很简单的,但是我还是那句话,我写的是新手日记,让新手和我一起成长。

我先说下概念的东西,一会FAStT600一会DS4300,也许很多新手会晕,其实这是同个型号的机器,DS4000系列原本叫FAStT系列,IBM2004年将其更名成DS4000系列。新的DS4200DS4700DS4800因为是在更名之后才推出市场的,因此没有所对应的FAStT型号。
而旧的比如:
FASt100——>DS4100
FASt600——>DS4300
FASt700——>DS4400
FASt900——>DS4500
......

就不详细列举了.
换电池之前要做些准备工作,比如要和客户协商什么时候可以停业务(对于业务量小的可以不用停),让客户做些数据的备份。 也别用太多时间。

其实最好是能停业务,保证安全,不停也不是不能做,我就说不停业务怎么来做吧。

首先:
找个交换机,然后用SMStorage Manager)连接2个控制器,这里注意必须同时连2个,除了换硬盘可以连一个。关于怎么连控制器好像我前面写的更换硬盘的文档写的很清楚了,就不啰嗦了。
然后:进去后先点那个听诊器的图标看有没有报错,肯定有,但是主要看有没有除了电池FAILED以外的其他报错,有其他的算你倒霉,先修其他的再换电池。

假如没有其他报错,我们来换电池。
先进行控制器的业务切换,比如你要换A控制器的电池就把A控制器的业务都扔到B控制器上,反之。
劝你更换之前把所有的profile文件收了,后面的新版本的SM里面有Colleted All Support Data的项目,全部收了就是了,这是个好的办事方式,也不是说一定要弄,你们明白我的意思。

你可以选中A控制器,然后在Advanced的选项中Recovery ->lace Controler将它OFFLINE,或者是
在另外一个菜单中有Change Controler到另外一个上,保证你选择旁边的LUN的时候不会显现有你所要更换的控制器还有连接。

现在你就可以后机器后面看是不是警示灯亮了,亮了就开始吧,拔出来,找螺丝刀卸开,然后更换,这里基本注意下静电没什么说的,这种东西我不给你说你也知道怎么装,装完后按上面一步的步骤将控制器ONLINE或者Change Controler切回来就可以了,然后观察个半小时的,有时候换完不会突然就不报错了,错误可能要要报,但是最多半个小时就不报了。

***************************************
最后我讲个条件:你做之前要先查看硬盘的微码,因为我听老大们说过有几个硬盘微码版本是不能直接更换电池的,会掉硬盘的,那后果就是整个RAID垮掉,所有这里不完全的就是你最好打听一下那个版本的硬盘微码条件下不能贸然升级!!!小心慎重啊!!!

****************************************
论坛上有知道这几个危险版本的兄弟最好给大家说一下,免的*******

############硬盘的微码如果是JFQ3或者是JFQ4的话,是一定要升级硬盘微码的,这个在传说中的IBM内部使用的《DS4000快速维护手册》里面有写的呀,你没这个东东么?

七、TakeOver方式的HACMP的安装

Hacmp 一个困扰了N多人的东西,下面我简单说说,为什么是简单说说呢,因为我不指望你看了我写的这个就完全会了HACMP,我只是先给你建立一个概念~,我的了解也是很肤浅的,互相学习吧。
先说意义:英文就是高可用性
我简单画个结构图(2个节点为例):

弄以前先定义HOSTS文件
位置:/etc/hosts                         ------------定义boot ip / service ip / standby ip
格式:
100.100.1.3      test1_boot
100.100.1.4      test1_svc
192.168.1.3      test1_stb

100.100.1.5     test2_boot
100.100.1.6      test2_svc
192.168.1.5      test2_stb


配置/usr/sbin/cluster/netmon.cf       -----这个玩意是监控HA
就是把上面所有的IP复制进来就行了
格式:
100.100.1.3      
100.100.1.4      
192.168.1.3      

100.100.1.5     
100.100.1.6      
192.168.1.5      
然后看模型:

                     Cluster【建立个CLUSTER,就比如你建立个工程吧,为这个HA取个名字】
                        |
                                    |
                                   /\
                                 /    \
                               /        \
                         Node1       Node2              ----NODE也就是你的节点,可以理解成两台机器
                   |                  |
                  定义Node的网络          ----建立两网络,TCP的做对外业务用,RS232心跳
                   |                  |
                   把网络设备加到node的网络里    ---就是要绑定地址,把BOOT地址绑到NODE
                   |                  |
                               添加资源组             ---就是定以所属资源,SVC IP了,还有其他脚本
                                 |
                                    同步                ---如果没错误,另一台机器会自动得到同样参数
                          |
                                   HACMP                  ----- smitty clstart
                                       |
                                    测试                -----Down节点了,Down 网卡了,随便搞
                 
这就是大体的模型,后续我会继续详细的讲~~

八、7133磁盘系统更换硬盘



补充一下上一篇的遗留问题,上面有个兄弟已经说了,如果硬盘的微码是JFQ3JFQ4先升级微码然后更换

下面来说说7133如何来换硬盘,换硬盘嘛,都是些打杂的活,谁让咱是新人呢?历练呗!!!

7133的硬盘不需要停业务,在线换就成,下面我说一下7133RAID后的换盘方式,做镜像的暂时不说哈。

下午和一个同事要了ServiceGuide,提着硬盘就去了,客户带我进去后,我先打开本子开始研究如何换。

其实呢,有两种情况,一个就是硬盘真的挂了,已经亮黄灯了,另一种情况就是硬盘在临界状态了,小机已经不断告警了,但是7133没什么反应的。前一种好弄,而后一种情况就要麻烦了。

算我背,我遇到的就是第二种,先说一下第一种的对策:
#smitty ssaraid

List/Identify SSA Physical Disk          ----SSA硬盘

list rejected array disks                    -----找被系统踢出来的硬盘(只有第一种情况能看到)

然后
#errpt |pg                                    -----找系统报的是那个pdisk的问题,我这里是pdisk1
接着
#lscfg -vl pdisk1                             ------注意吧location code抄下来,比如
                                            14-0B-34EE-04-P,就是第四个硬盘有问题,前面是1-8号盘,后面是9-16
然后继续查信息

#ssaxlate -l pdisk1                          ------查属于那个array disk的,这里查实是DISK2
然后继续,被这个盘搞到Service mode(服务模式)

#diag               -----------选第三个,进去找ssa service aids,进入

set service mode   ---pdisk搞到Service mode,搞完后那个烂盘就会亮黄灯了

后面就不用说了,最经典的两个字:拔、插

等下说物理上插拔完新硬盘后的事情,先说第二种情况的解决方法,就是我遇到的硬盘在临界状态的换盘方法。

最开始的步骤一样,先看报错,然后把pdisk location code 弄清楚,还有它属于那个Array disk

然后呢我们无法在被系统踢出去的盘列表那个找到这个烂盘,我们要手动来踢


#smitty redssaraid
然后
                         change member disks in an SSA RAID Array
然后
                         remove a disk from an SSA RAID Array
然后选属于那个Array disk ,前面查完的,我这里是hdisk2

然后还是上面的步骤把它置于Service Mode
接着物理更换

好了,两种情况都写完了,下面看物理更换后的后续步骤

然后删以前的逻辑盘
#rmdev -dl pdisk1
删了后,cfgmgr -v 重新认出来新的盘

接着就是定义这个盘的作用

#smitty ssaraid
然后
      change/show use of an ssa physical disk
以前这个盘是做什么的就选什么,热备的就选Hot spare,阵列的就选Array Candidate Disk,我的是阵列的


接着就是替换了,就是用新盘把就盘的应用什么的都给替换了


#smitty ssaraid

Next

change member disks in an ssa raid array

Next
         swap members of an ssa raid array

Nextdisk to remove 那里选就盘,肯定找不到了嘛~blankreserved,然后disk to add那里选新盘就是pdisk1

这步是用于将坏盘信息导入新盘,实现swap!!!!!!



最后就是刷新新盘
#smitty ssaraid
         list status of all defined ssa raid array
            
选择raid10
等待.................................................
直到100%

这里你等一下,我做的时候一直都是2%过不去,我重新刷新了一下看到已经是GOOD状态了,就知道完了



最后说一下,如果是双机,那现在也在另外一台上先删了pdisk1,然后cfgmgr认出来!!!

警告一下:如果没删就cfgmgr,那会多出来一块盘,那就惨了,倒是没什么大问题,但是会在客户面前显示出你的极度不成熟~~

遇到这个了就用前面的方法 ,把两个(新的和旧的)都删了,重新认就行了。

这就步骤都完了,让客户检查一下,没什么问题就签单子走人!

九、机器报修与维护基本操作流程



这两天在总结一些DS8000升级的东西,等写好了发上来。
今天说点的东西吧,讲给那些新入行的兄弟们的,如何来处理一个维修业务!

以下是我建议的一些操作流程,当然公司不同,流程也不同,但是以下都是必须的!


1.做报修前先与客户沟通,进行问题的近一步确认:初步拟定停机时间和操作时间段,明确机器序列号,以及该机器所接存储或其他环境因素,顺手查一下还在不在你们公司的保内。

2.进行初步预判断,准备基本所需的工具和备件,注意备件的可替代关系

3.提前阅读此次状况所涉及机型的Service Guide以及其他技术文档

4.更换备件前先收集系统SNAP文件备用(可发给老工程师帮你确认一下原因)

5.现场进行故障判断后,初步拟定实施方案,和客户确认方案与应急回退措施 这里重要!

6.和客户确认机器业务都已经停完,无应用在访问(某些维修无须停业务则跳过)

7.参照ServiceGuide进行备件的更换和维护,过程中要仔细认真,正确找到Location code所指出的位置

8.维护后请客户当场检查业务是否正常(重要)

9.签订服务报告

  后面的可以自由发挥,请客户吃饭或者其他项目,视公司与环境不同而不同!

【技巧】多分区情况下的光驱NFS映射

好多天没更新了,既然还有人关注就接着写,其实看到有人顶才有动力写下去,要不多无聊

这几天做一个旧机器整改的项目,客户替换下来4690,让把这些东西重新分区装系统

比较枯燥的事情,所以决定和师傅一起搞点新玩法

第一台690做了2个分区,然后做了动态LPAR,但是这里有说道了,POWER 4的机器做LPAR真没做过,这个是师傅搞定了,后续我弄明白了写给大家

接着说,这2个分区一个装了系统,但是另外一个光驱还没切过去,但是又没法进机房了,所以想找些比较另类的方法

所以请教完一个兄弟后,就开始了,分区一是 LAPR1,分区二是LPAR2

我现在的光驱分给了LPAR1, 无法进机房用HMC调整,但是又必须使用光驱,哪么如下:


首先在有光驱的分区就行操作:

首先建  /cdrom 的文件系统,然后mount起来

接着到etc目录下做个配置文件

vi exports

内容输入:

/cdrom -ro             意思是加载这个文件系统以readonly模式

然后ESC - : -wq  退出

现在就是用命令
#mknfs -N
重启网络文件系统

然后
#exportfs -a
导出文件系统
这样在另外一个分区

#mkdir cdrom    建个映射目录先

#mount 192.168.100.100:/cdrom  /cdrom   然后mount 起来就可以了,那个IP是有光驱的那个分区的网络地址

这样两边都可以用光驱了,但是没办法同时用,不过也懒的到机房调整了

 DS8000划盘第一讲

我觉的吧,写这东西的时候在想,授之以鱼不如授之以渔

我只是想把自己的经验写出来,而这种东西也是我刚开始最需要的东西,但并不等于你可以不看书

技术这个东西总是踩在前辈的肩膀上才能看的更高,而这些经验也就成了很多人保密不愿

意与人共享的东西,每个人的想法不一样,我只是希望能以探讨的方式和大家一起进步

再说一下,希望新手们能有个好的习惯,将自己做过的CASE详细记录下来然后分析一下那里做的

风险比较大,不够规范,在新学的时候千万要养成规范操作的好习惯,不要所有的操作都模仿老

工程师们,人家可以那样做但并不代表你可以,你的知识还不全面!!!!!


下面我来说吧,但是这个东西我希望自己能给你们写的尽量加入原理尽量详细,如果图省事,我完

全给你们挂个写好的脚本就可以了,完全可以写成大象装冰箱!

-------------------------------------------------废话完了,开始学习-------------------------------------------

DS8000划盘我准备分四节来讲
第一节:涉及到的基本概念
第二节:划盘前的项目规划
第三节:划盘的实战操作
第四节:最后的一些过程中的问题的总结

BTW:各位,对于我写的东西有疑问请提出来,也算是对我义务劳动成果的肯定吧!


DS8000中涉及基本概念:

先提醒:DS8000里面的存储概念和AIX完全没多大关系,别把这里的词汇和AIX混淆

1)什么是DISK
   也就是DDM,也就是硬盘
2)什么是 array sites
   通俗点说也就是在DS8000中的8个同一组的相同速度和大小的硬盘
3Arrays
   就是说在8000中这么一个array sites 可以看做是一个队列
4Enclosure
   IBM内部叫盘包,外面很多集成商叫硬盘笼子,就是你看到的一个装了16块硬盘的那个东西,暂且叫它盘包,中间有2control card ,每个Enclosure 2arrary site
5280D280B
   就是常说的HBA卡,这两个编号唯一不同的就是一个4G带宽,一个2G
6DA pair
   说白了就是个环路的概念,7133那个年代说的环路A1,A2,B1,B2DS8000上的DA0,DA1,DA2,DA3是一个道理,DA卡是FC-AL模式的,也就是所说的仲裁环。
7PS

  8000项目中经常在决定做RAID的时候听过6+p+s或者是7+s......

  具体什么意思呢?   P代表校验盘,S就是热备盘(Hotspare

上面说过,在80008个硬盘划为一个队列,所以任何组合的和值必须是8

  基本的RAID与校验盘和热备盘的设计种类

RAID5  : 6+P+S      /     7+P

  RAID10:   3*2+2S    /     4*2

  一般整个下来每个DA环路有4个热备,这就可以解释为什么DS8000有时候盘坏了不亮灯也不报警

里面有个设计思路,每个DA环路硬盘坏3块及以上才报警,当然有些CALL home的错误坏一个盘

也会报
8RANK
   这个东西你只需要记住    1rank=1array=8ddm  就可以了
9Extent Pools
   通俗的就是同一类数据类型的一个集合
  这个设计是有一些授权的东西在里面,一般做2Extent Pools,每个对应一个主机

10DA CARD
   就是所说的DA卡,从8000后面看就是上面有42G光纤口的那个卡,作用就是连接处理器和磁盘阵列,一般都是成对安装,所以就有了 DA pair的概念
11WWPN
   Worldwide Port Name,就是你小鸡上的HBA的一个注册编号,你可以理解成象PC上的MAC地址一样的东西就行了
  在小鸡里可以用lscfg查看,network address 后面那串就是,好像是16位数
12SDD
   就是一个软件,装在小鸡上的,用来识别8000VPATH,里面的包有几个是必须的,可以根据你业务不同装,但是有2个不要装
  devices.fcp.disk.ibm.mpio.rte
   devices.sddpcm.52.rte or devices.sddpcm.53.rte
   我只是知道不要装,还没的人告诉我为什么不能装,等我知道了再告诉你们!这玩意啥子版本的都有,windows也可以装,下个WIN32版的就可以了
13)没了

第二节,开始说说这个规划吧

这里似乎问题真的很多,反正也不是一天两天能说的清楚的,慢慢来,反正我不急

其实我写了N篇了,点击率似乎也几千了,但提出疑问的没多少,希望大伙还是能提出些错误或者

疑问来,否则这不是又成了我一个瞎墨迹了,看了的兄弟多顶顶,提点问题

开始吧

今天先唠叨规划的第一步,你的先认清楚型号啊!!

DS8000是一个统称,也叫一个系列

下面有DS8100DS8300了如何区分了???

MT~~moden呢都是2107

TYPE了?  921   也就是DS81002路的一个入门级的
           922   也就是DS83004路的
           9A2   83004路的
扩展柜呢?
           921922的扩展柜叫92E
                9A2的扩展柜叫9AE

           上面说的几路几路都明白哈,就是比如这里81002路就是每个CEC有一个CPU卡,2CEC
所以是2路。

至于9229A2 的区别我个人认为就是一个分区的区别
9A2官方的说法叫:two storage images in one machine 

我觉的说白了就是象小鸡里面的逻辑分区的概念,暂且这么理解。

对了,还有就是上次有人Q上问我说DA卡那块解释的不太清楚和FC卡没说怎么区别

这么说吧,8000后面的I/O Enclosure上一般只有3种接口

接了4跟蓝色的线的是DA卡,作用就是直接到DDM的,传数据的

接了黑色粗线的那个是RIO cable,是I/OCEC通讯的

还有接了4个光纤的那个就是FC卡,通过光纤和主机HBA相连

这样说应该比较清楚了吧

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/11134849/viewspace-611314/,如需转载,请注明出处,否则将追究法律责任。

请登录后发表评论 登录
全部评论

注册时间:2009-07-19

  • 博文量
    153
  • 访问量
    474763