ITPub博客

首页 > Linux操作系统 > Linux操作系统 > SAP 性能优化之监控篇-硬件监控[读书笔记]

SAP 性能优化之监控篇-硬件监控[读书笔记]

原创 Linux操作系统 作者:leniz 时间:2009-12-10 11:48:05 0 删除 编辑

SAP 性能优化之监控篇
硬件监控
SAP性能监控器是分析性能的工具。它们在性能菜单中被一起列出(事务代码STUN)。要调用这个菜单,选择:
Tools -> Administration -> Monitor -> Performance 或者
Tools -> CCMS -> Control/Monitoring -> Performance menu
操作系统监控器是用来分析硬件瓶颈和操作系统问题的工具。要为你目前登陆的应用系统启动操作系统监控器,选择
Tools -> Administration -> Monitor -> Performance -> Operating System -> Local -> Activity
或输入事务代码ST06。如果要选择其他的服务器,可以先用OS07作服务器选择。
接下来我们就针对ST06来逐一学习。

图 1

系统通过SAPOSCOL这个程序,每10秒刷新一下数据。从上图可以看到,页面被分割成CPU, Memory, Swap, Disk with highest response time和Lan(sum)共5段。
这裡解释一下相关栏位的意思
CPU
Utilization user(用户利用率):由用户工作处理进程引起的CPU负载(SAP系统,数据库等等)
Utilization System(系统利用率): 由操作系统引起的CPU工作负载
Utilization idle(空閒利用率):空閒的CPU能力。这个值至少为20%,教理想的应该为35%。
Count:处理器的数量
Load Average(平均负载):在1分钟,5分钟或者15分钟内等待处理器的工作处理进程的平均数量

Memory
Physical mem avail Kb(可用的物理主存容量Kb):可用的物理主存容量。
Page in/on : 操作系统的内存页交换速率和内存页交换的数据量

Swap
这裡有Swap space的数量,它的值必须是物理内存的3倍,并且不能小于3.5G。

那么我们如何去利用这些数据呢?
首先,CPU Utilization idle中指明的CPU容量通常平均每个小时应该至少为20%。这样才能保证系统对临时性工作高峰的负载,如果有35%以上则更好。内存交换速率不应该变得太大。作为一个经验上的原则,如果每小时内存页交换的的物理主内存容量小于20%,内存页交换就不是那么严重的。对于异步内存页交换的操作系统(例如,Windows NT),在操作系统监控器中Page-in Rate表示的值是内存页交换性能的关键性指标,对与其他的操作系统,只有当必需的时候才进行内存页交换(例如大部分的Unix派生产品),最重要的统计数据是Page-out Rate.
出现了超值情况也不一定就意味着有硬件瓶颈,需要进一步分析。

在操作系统监控器(事务代码ST06)中,选择:
Detail analysis menu -> TOP CPU
可以显示目前操作系统的进程以及其资源占用情况。工作进程的命名规则:
“disp+work”(Windows NT)或“dw+(UNIX)


引起硬件瓶颈的原因
在一个有多台计算机的分布式系统中,如果发现至少有在一台机子上发现硬件瓶颈,而其他计算机还有未被使用的资源,那么这可能是由于工作负载没有被优化的分配造成的。要提高性能,需要重新分配SAP工作处理进程和用户登陆。
数据库服务器上有足够资源非常重要,否则将意味着很糟糕的响应时间。

要检查单个进程是否影响造成了CPU的长时间繁重负载,在上述界面中定时地去刷新数据,查看结果。并打开工作进程一栏(事务代码SM51),结合图ST06-002,通过PID来做对应,查看相关进程的占用情况,并可以深入分析进程所处理的事务得到系统性能问题的根源,该优化的优化,该处理的处理。如果是DB进程的占用,可以同时打开Performance Analysis(事务代码ST05)进行SQL语句跟踪。
以上工具相互结合,大体上可以把一下系统内瓶颈问题查找出来。
除了重视SAP工作进程外,其实系统本身的一些处理进程也可能造成系统的瓶颈,这些也需要我们甄别出来,查找处理的方法都类似。

这裡大家可能会发现遗漏一个很重要的叙述,那就是I/O问题。因为它的效率是很低的,对系统的影响更大。


在操作系统监控器(事务代码ST06)下:
Detail analysis menu -> Disk
可以看到硬盘的负载情况

Disk :硬盘在操作系统中的符号
Resp. : 硬盘的平均响应时间(单位msec)
Until.:  硬盘上的负载
Queue Len. : 等待I/O操作的进程数量
Wait: 等待时间
Serv:服务时间

双击硬盘列表,可以看到过去24小时详细的负载情况。在这里,如果Util栏的值操作50%,表示某个单个的硬盘上有繁重负载,这可能说明存在I/O瓶颈问题。但是如果要进行更为详尽的分析,需要硬件厂家提供的专门工具。

总结
如果出现下列情况可能表明有性能问题
1. 每小时平均的CPU空闲资源低于20%
2. 每小时有大于20%的物理主内存容量被用于内存页交换
3. 单个硬盘的利用率超过50%

 

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/554557/viewspace-622104/,如需转载,请注明出处,否则将追究法律责任。

下一篇: 查分查出的思考
请登录后发表评论 登录
全部评论

注册时间:2008-05-31

  • 博文量
    448
  • 访问量
    1128277