ITPub博客

Oracle10g AWR及ASH详解(final)

原创 作者:tolywang 时间:2009-07-17 18:43:55 0 删除 编辑


演示AWR安装及生成报告:

SQL> conn / AS SYSDBA
SQL> @/u01/product/oracle/rdbms/admin/awrrpt.sql
输入 report_type 的值: <enter默认为html类型>
输入 num_days 的值: 2                          --- 现在到过去两天时间内的snap id (可以查看到).
输入 begin_snap 的值: 2147                     --- 输入的开始及结束的snap id 对应您要查找的出现问题的时间段。 
输入 end_snap 的值: 2182 
输入 report_name 的值: <enter采用默认文件名>
Report written to awrrpt_1_2177_2182.html
SQL> exit  

下载awrrpt_1_2177_2182.html并打开查看。

 

 

认识AWR 

Oracle 10g 开始提供了一个显著改进的工具:自动工作负载信息库AWR (Automatic Workload Repository). Oracle 建议用户用这个取代 Statspack。

AWR 是一个Oracle10g的内置工具,它采集与性能相关的统计数据,并从那些统计数据中导出性能量度,以跟踪潜在的问题。与 Statspack 不同,快照由一个称为 MMON 的新的后台进程及其从进程自动地每小时采集一次(在oracle10G中引进了两个新的进程:mmon和mmnl,其中MMON承担了大部分的工作)。为了节省空间,采集的数据在 7 天后自动清除。快照频率和保留时间都可以由用户修改。它产生两种类型的输出:文本格式(类似于 Statspack报表的文本格式但来自于 AWR 信息库)和默认的 HTML 格式(拥有到部分和子部分的所有超链接),从而提供了非常友好的用户报表。 


AWR 用几个表来存储采集的性能统计数据,所有的表都存储在 SYSAUX 表空间中的 SYS 模式下,并且以 WRM$_*(5個) 和 WRH$_*(94個)的格式名。前一种类型存储元数据信息(如检查的数据库和采集的快照),后一种类型保存实际采集的统计数据。H代表“历史数据 (historical)”而 M 代表“元数据 (metadata)”。在这些表上构建了几种带前缀 DBA_HIST_ 的视图,这些视图可以用来编写您自己的性能诊断工具。视图的名称直接与表相关;例如,视图 DBA_HIST_SYSMETRIC_SUMMARY 是在WRH$_SYSMETRIC_SUMMARY 表上构建的。要使用AWR必须设置STATISTICS_LEVEL参数,共有三个:BASIC, TYPICAL,ALL。如果设为BASIC将禁用许多特性,如ADDM (Automatic Database Diagnostic Monitor ADDM)自动数据库诊断监视器。安装Oracle 10g后,默认值是TYPICAL。AWR的统计数据默认保留7天,并且每小时获取一次快照。


 
一、 ASH(v$active_session_history)和AWR  

1.     10g之前用户的连接将产生会话,当前会话记录保存在v$session中;处于等待状态的会话会被复制一份放在v$session_wait中。当该连接断开后,其原来的连接信息在v$session和v$session_wait中就会被删除。这是10g之前的状况。

2.     v$session_wait_history与ASH若是一个普通的会话(我是指没有大量地耗费资源),则对于性能调整来说无足轻重。但若该会话在活动时大量占用了资源(比如:CPU,内存,I/O等),该会话信息的丢失,将无法评测当时的系统瓶颈究竟是什么。令DBA高兴的是,oracle10g中保留下了v$session_wait中的这些信息。在10g中新出现了一个视图:v$session_wait_history。这个视图保存了每个活动session在v$session_wait中最近10次的等待事件(ASH缺省每一秒收集一下v$session中活动会话的情况,记录会话等待的事件,不活动的会话不会被采样 ,间隔时间由 _ash_sampling_interval 参数确定)。但这对于一段时期内的数据性能状况的监测是远远不够的,为了解决这个问题,在10g中还新添加了一个视图:v$active_session_history。这就是ASH(active session history)。典型的情况下,为了诊断当前数据库的状态,需要最近的五到十分钟的详细信息。然而,由于记录session的活动信息是很费时间和空间的,ASH采用的策略是:保存处于等待状态的活动session的信息,每秒从v$session_wait中采样一次,并将采样信息保存在内存中(ASH的采样数据是保存在内存中)。


3.     AWR注意,ASH的采样数据是保存在内存中。而分配给ASH的内存空间是有限的,当所分配空间占满后,旧的记录就会被覆盖掉;而且数据库重启后,所有的这些ASH信息都会消失。这样,对于长期检测oracle的性能是不可能的。在Oracle10g中,提供了永久保留ASH信息的方法,这就是AWR(automatic workload repository)。
      由于全部保存ASH中的信息是非常耗费时间和空间的,AWR采用的策略是:MMON进程每小时对ASH (v$active_session_history)进行采样一次,并将信息保存到磁盘中,当ASH BUFFER满2/3的话MMNL进程会写,并保留7天,7天后旧的记录才会被覆盖。这些采样信息被保存在表wrh$_active_session_history中。而这个采样频率(1小时)和保留时间(7天)是可以根据实际情况进行调整的,这就给DBA们提供了更加有效的系统监测工具。    AWR永久地保存系统的性能诊断信息,由SYS用户拥有。一段时间后,你可能想清除掉这些信息;有时候为了性能诊断,你可能需要自己定义采样频率来获取系统快照信息。Oracle 10g在包dbms_workload_repository中提供了很多过程,通过这些过程,你可以管理快照并设定基线(baselines:用于保存指定时间段的历史数据用于将来分析及对比 )。

4.   ASH保存了系统最新的处于等待的会话记录,可以用来诊断数据库的当前状态;而AWR中的信息最长可能有1小时的延迟,所以其采样信息并不能用于诊断数据库的当前状态,但可以用来作为一段时期内数据库性能调整的参考。


备注:  视图dba_hist_active_sess_history是wrh$_active_session_history和其他几个视图的联合展现,通常通过这个视图进行历史数据的访问。

 

二、详细介绍 AWR 

1.   ASH的采集信息保存在内存中,在旧的信息被采样到AWR中后,可被新采集的信息覆盖,重启oracle后该信息被清除。分配给ASH的内存大小可以查询到:

SQL> select pool, name, bytes/1024/1024 From v$sgastat where name like '%ASH %';

POOL          NAME          BYTES/1024/1024
------------- ------------- ---------------
shared pool   ASH buffers                 6


2.   其实AWR记录的信息不仅是ASH,还可以收集到数据库运行的各方面统计信息和等待信息,用以诊断分析。
AWR的采样方式是,以固定的时间间隔为其所有重要的统计信息和负载信息执行一次采样,并将采样信息保存在AWR中。可以这样说:ASH中的信息被保存到了AWR中的视图wrh$_active_session_history中。ASH是AWR的真子集。


3.   mmon进程与mmnl进程快照由一个称为 MMON 的新的后台进程(及其从进程)以及MMNL后台进程自动地每隔固定时间采样一次。我们先来看一下这两个新增加的后台进程的介绍:
        MMON进程负责执行多种和管理相关(manageability-related)的后台任务,例如:
当某个测量值(metrics)超过了预设的限定值(threshold value)后提交警告 创建新的 MMON 隶属进程(MMON slave process)来进行快照(snapshot) 捕获最近修改过的 SQL 对象的统计信息
        MMNL进程负责执行轻量级的且频率较高的和可管理性相关的后台任务,例如捕获会话历史信息,测量值计算等。AWR的采样工作由MMON进程每个1小时执行一次,ASH信息同样会被采样写出到AWR负载库中。虽然ASH buffer被设计为保留1小时的信息,但很多时候这个内存是不够的,当ASH buffer写满后,另外一个后台进程MMNL将会主动将ASH信息写出。


4.   SYSAUX表空间这些采样数据都存储在SYSAUX表空间中,并且以WRM$_* 和 WRH$_*的格式命名。前一种类型存储元数据信息(如检查的数据库和采集的快照),后一种类型保存实际采集的统计数据。

SQL> select table_name from dba_tables where table_name like 'WRM$%';

TABLE_NAME
-----------------------
WRM$_WR_CONTROL
WRM$_SNAP_ERROR
WRM$_SNAPSHOT
WRM$_DATABASE_INSTANCE
WRM$_BASELINE

当SYSAUX表空间满后,AWR将自动覆盖掉旧的信息,并在警告日志中记录一条相关信息:
ORA-1688: unable to extend table SYS.WRH$_ACTIVE_SESSION_HISTORY partition WRH$_ACTIVE_3533490838_1522 by 128 in tablespace SYSAUX 


5.  采样频率和保留时间可以通过查询视图dba_hist_wr_control或(wrm$_wr_control)来查询AWR的采样频率和保留时间。默认为每1小时采样一次,采样信息保留时间为7天。
SQL> select * from dba_hist_wr_control;

DBID SNAP_INTERVAL RETENTION   TOPNSQL
---- ------------- ----------- ----------
1148 +00000 00:1   +00007 00:0 DEFAULT


SQL> select DBID, SNAP_INTERVAL, SNAPINT_NUM, RETENTION from wrm$_wr_control;

      DBID SNAP_INTERVAL      SNAPINT_NUM RETENTION
---------- ------------------ ----------- --------------------
1160732652 +00000 01:00:00.0         3600 +00007 00:00:00.0

设置每半小时一次,并且保留5天 。
SQL> exec dbms_workload_repository.modify_snapshot_settings(interval=>30, retention=>5*24*60);  


6.   采样数据量由于数据量巨大,把所有ASH数据写到磁盘上是不能接受的。一般是在写到磁盘的时候过滤这个数据,写出的数据占采样数据的10%,写出时通过direct-path insert完成,尽量减少日志生成,从而最小化数据库性能的影响。


7.   初始化参数statistics_level, AWR的行为受到参数STATISTICS_LEVEL的影响。这个参数有三个值:
       BASIC:     awr统计的计算和衍生值关闭.只收集少量的数据库统计信息.
       TYPICAL:   默认值.只有部分的统计收集.他们代表需要的典型监控oracle数据库的行为.
       ALL : 所有可能的统计都被捕捉. 并且有操作系统的一些信息.这个级别的捕捉应该在很少的情况下,比如你要更多的sql诊断信息的时候才使用.

 


三、使用AWR 

   AWR由ORACLE自动产生,不过也可以通过DBMS_WORKLOAD_REPOSITORY包来手工创建、删除和修改。可以使用desc命令查看该包中的过程。下面只介绍几个常用的:

1.手工创建一个快照
SQL> select count(*) from wrh$_active_session_history;
  COUNT(*)
----------
     317  

SQL> begin
  2  dbms_workload_repository.create_snapshot();
  3  end;
  4  /

PL/SQL 过程已成功完成。
SQL> select count(*) from wrh$_active_session_history;
  COUNT(*)
----------
       320


2.手工删除指定范围的快照
SQL> select * from wrh$_active_session_history where snap_id = 96;
   SNAP_ID       DBID INSTANCE_NUMBER  SAMPLE_ID SAMPLE_TIME
---------- ---------- --------------- ---------- ----------------------------
        96 1160732652               1     236930 06-10月-07 11.26.04.562 上午
        96 1160732652               1     236930 06-10月-07 11.26.04.562 上午
        96 1160732652               1     236930 06-10月-07 11.26.04.562 上午

SQL> begin
  2  dbms_workload_repository.drop_snapshot_range(low_snap_id => 96, high_snap_id => 96, dbid => 1160732652);
  3  end;
  4  /
PL/SQL 过程已成功完成。
SQL> select * from wrh$_active_session_history where snap_id = 96;
未选定行


3.修改采集时间和统计信息保留时间
PROCEDURE MODIFY_SNAPSHOT_SETTINGS
参数名称                       类型                    输入/输出默认值?
------------------------------ ----------------------- ------ --------
RETENTION                      NUMBER                  IN     DEFAULT
INTERVAL                       NUMBER                  IN     DEFAULT
TOPNSQL                        NUMBER                  IN     DEFAULT
DBID                           NUMBER                  IN     DEFAULT

通过修改retention参数可以修改awr信息的保留期限。默认的是七天,最小的值是一天。如果把retention设置为零,自动清除就关闭了.如果awr发现sysaux空间不够,它通过删除那些最老部分的快照来重新使用这些空间.同时,也会给dba发一条警告,告诉sysaux空间不够了(在alert log中).通过修改interval参数可以修改awr信息的采样频率。最小的值是10分钟,默认的是60分钟.典型的值是10,20,30,60,120等等。把interval设为0则关闭自动捕捉快照.如将收集间隔时间改为30 分钟一次。并且保留5天时间(注:单位都是为分钟):

SQL> select *from dba_hist_wr_control;
      DBID SNAP_INTERVAL      RETENTION          TOPNSQL
---------- ------------------ -------------------------- -----------
1160732652 +00000 01:00:00.0  +00007 00:00:00.0          DEFAULT

SQL> exec dbms_workload_repository.modify_snapshot_settings(interval=>30, retention=>5*24*60);
PL/SQL 过程已成功完成。

SQL> SELECT *from dba_hist_wr_control;
      DBID SNAP_INTERVAL       RETENTION         TOPNSQL
---------- ------------------- ------------------------- -----------
1160732652 +00000 00:30:00.0   +00005 00:00:00.0         DEFAULT

SQL>


4.设置基线
基线(baseline)是一种机制,这样你可以在重要时间的快照信息集做标记。一个基线定义在一对快照之间,快照通过他们的快照序列号识别.每个基线有且只有一对快照。一次典型的性能调整实践从采集量度的基准线集合、作出改动、然后采集另一个基准线集合开始。可以比较这两个集合来检查所作的改动的效果。在 AWR 中,对现有的已采集的快照可以执行相同类型的比较。
假定一个名称为 apply_interest 的高度资源密集的进程在下午 1:00 到 3:00 之间运行,对应快照 ID 95 到 98。我们可以为这些快照定义一个名称为

apply_interest_1 的基准线:
SQL> select *From dba_hist_baseline;

未选定行

SQL> select * from wrm$_baseline;

未选定行

SQL> exec dbms_workload_repository.create_baseline(95, 98, 'apply_interest_1');

PL/SQL 过程已成功完成。

这一操作将快照从 95 到 98 编号,作为上面指定的基准线的一部分。查看现有的基准线:
SQL> select *from dba_hist_baseline;

      DBID BASELINE_ID BASELINE_NAME     START_SNAP_ID START_SNAP_TIME               END_SNAP_ID END_SNAP_TIME
---------- ----------- ------------------------- ------------- ------------------------------------- ----------- ------------
1160732652           1 apply_interest_1             95 06-10月-07 11.00.05.375 上午           98 06-10月-07 01.44.58.062 下午

SQL> select *from wrm$_baseline;

      DBID BASELINE_ID BASELINE_NAME        START_SNAP_ID END_SNAP_ID
---------- ----------- ---------------------------- ------------- -----------
1160732652           1 apply_interest_1                95          98

SQL>

在一些调整步骤之后,我们可以创建另一个基准线 — 假设名称为 apply_interest_2,然后只为那些与这两条基准线相关的快照比较量度。
SQL> exec dbms_workload_repository.create_baseline(92, 94, 'apply_interest_2');

PL/SQL 过程已成功完成。
像这样把快照分隔在仅仅几个集合中有助于研究调整对于性能量度的影响。您可以在分析之后使用 drop_baseline() 来删除基准线;快照将保留(也可级联删除)。 此外,当清除例程开始删除旧的快照时,与基准线相关的快照不会被清除,从而允许进行进一步的分析。

 

5.删除基线

如果要删除一个基准线:
SQL> exec dbms_workload_repository.drop_baseline(baseline_name=>'apply_interest_1', cascade=>false);

PL/SQL 过程已成功完成。

SQL> select *from wrh$_active_session_history where snap_id in (95,96,97,98);

   SNAP_ID       DBID INSTANCE_NUMBER  SAMPLE_ID SAMPLE_TIME
---------- ---------- --------------- ---------- -------------------------------
        95 1160732652               1     235360 06-10月-07 10.56.29.872 上午
        95 1160732652               1     235230 06-10月-07 10.54.19.857 上午
        95 1160732652               1     233130 06-10月-07 10.19.19.478 上午
        95 1160732652               1     232830 06-10月-07 10.14.18.859 上午
        95 1160732652               1     232250 06-10月-07 10.04.38.481 上午
        97 1160732652               1     238600 06-10月-07 12.33.08.420 下午
        97 1160732652               1     238600 06-10月-07 12.33.08.420 下午
        97 1160732652               1     238600 06-10月-07 12.33.08.420 下午
        97 1160732652               1     238600 06-10月-07 12.33.08.420 下午
        97 1160732652               1     238600 06-10月-07 12.33.08.420 下午
        97 1160732652               1     238600 06-10月-07 12.33.08.420 下午

   SNAP_ID       DBID INSTANCE_NUMBER  SAMPLE_ID SAMPLE_TIME
---------- ---------- --------------- ---------- -------------------------------
        97 1160732652               1     238420 06-10月-07 11.50.55.686 上午
        97 1160732652               1     238230 06-10月-07 11.47.45.687 上午
        98 1160732652               1     239140 06-10月-07 01.42.00.976 下午
        98 1160732652               1     239140 06-10月-07 01.42.00.976 下午
        98 1160732652               1     239140 06-10月-07 01.42.00.976 下午
        98 1160732652               1     239140 06-10月-07 01.42.00.976 下午
        98 1160732652               1     239140 06-10月-07 01.42.00.976 下午
        98 1160732652               1     239130 06-10月-07 01.27.04.161 下午
        98 1160732652               1     239130 06-10月-07 01.27.04.161 下午
        98 1160732652               1     239130 06-10月-07 01.27.04.161 下午

已选择21行。

SQL> exec dbms_workload_repository.drop_baseline(baseline_name=>'apply_interest_2', cascade=>true);

PL/SQL 过程已成功完成。

SQL> select *from wrh$_active_session_history where snap_id in (92,93,94);
未选定行

SQL>


待续..... 

 

上一篇: Oracle10g ASH and AWR
请登录后发表评论 登录
全部评论
Oracle , MySQL, SAP IQ, SAP HANA, PostgreSQL, Tableau 技术讨论,希望在这里一起分享知识,讨论技术,畅谈人生 。

注册时间:2007-12-10

  • 博文量
    5602
  • 访问量
    12949080