ITPub博客

首页 > 数据库 > Oracle > scn详解(二)

scn详解(二)

原创 Oracle 作者:xieyunchao 时间:2009-03-17 09:17:48 0 删除 编辑

Part III. scn(系统改变号)信息与恢复

control
中有三种SCN分别为,system SCNdatafile SCNlast SCN,数据文件头中有一种SCN start SCN
system scn
从视图v$database中获得,对应checkpoint_change#字段,datafile scnlast scn分别对应视图v$datafile中的checkpoint_change#last_change#,而 start scn则从v$datafile_headercheckpoint_change#得到。数据库在正常启动后下,system scn,datafile scn,start scn会相等,而last scn会被置于无穷大,这里为null正常关闭后(immediate,noraml,translate),上面四个scn会应执行full checkpoint 而相等。当系统在非正常关闭后,如shutdown abort,这个时候last scn依然为无穷大,那么当重新启动实例时,系统首先会比较start scnsystem scn,如果一致,那么再比较start scn last scan是否一样大,因为是非正常关闭,这里会不一样大,那么就需要例程恢复。如果打开数据库时发现system scn>datafile scn,那么以为着使用旧的备份数据文件,也就是需要介质恢复如果是system scn,及控制文件scn是旧的,代表使用了老的控制文件,需要recover using backup controlfile进行恢复。

1、正常启动时
SQL> select checkpoint_change# from v$database; --
控制文件中的scn

CHECKPOINT_CHANGE#
------------------
5534071
SQL> select file#,checkpoint_change# from v$datafile_header; --start scn

FILE# CHECKPOINT_CHANGE#
---------- ------------------
1 5534071
2 5534071
3 5534071
4 5534071
5 5534071
SQL> select file#,checkpoint_change#,last_change# from v$datafile; --datafile scn & last scn

FILE# CHECKPOINT_CHANGE# LAST_CHANGE#
---------- ------------------ ------------
1 5534071
2 5534071
3 5534071
4 5534071
5 5534071
2
、正常关闭后,然后在startup mount;
SQL> shutdown immediate;
数据库已经关闭。已经卸载数据库。
ORACLE
例程已经关闭。
SQL> startup mount;
ORACLE
例程已经启动。

Total System Global Area 319888364 bytes
Fixed Size 453612 bytes
Variable Size 192937984 bytes
Database Buffers 125829120 bytes
Redo Buffers 667648 bytes
数据库装载完毕。
SQL> select file#,checkpoint_change# from v$datafile_header;

FILE# CHECKPOINT_CHANGE#
---------- ------------------
1 5534485
2 5534485
3 5534485
4 5534485
5 5534485

SQL> select checkpoint_change# from v$database;

CHECKPOINT_CHANGE#
------------------
5534485

SQL> select file#,checkpoint_change#,last_change# from v$datafile;

FILE# CHECKPOINT_CHANGE# LAST_CHANGE#
---------- ------------------ ------------
1 5534485 5534485
2 5534485 5534485
3 5534485 5534485
4 5534485 5534485
5 5534485 5534485
--
发现start scn=last scn,证明系统是正常关闭

SQL> alter database open;

数据库已更改。

3、在正常打开状态下进行事务操作
SQL> create table t(a number);

表已创建。

SQL> insert into t values (1);

已创建 1 行。

SQL> commit;

提交完成。

SQL> insert into t values(2);

已创建 1 行。

4、非正常关闭
SQL> shutdown abort;
ORACLE
例程已经关闭。
SQL>

5、打开到mount状态下,观看scn
SQL> startup mount;
ORACLE
例程已经启动。

Total System Global Area 319888364 bytes
Fixed Size 453612 bytes
Variable Size 192937984 bytes
Database Buffers 125829120 bytes
Redo Buffers 667648 bytes
数据库装载完毕。
SQL> select file#,checkpoint_change#,last_change# from v$datafile;

FILE# CHECKPOINT_CHANGE# LAST_CHANGE#
---------- ------------------ ------------
1 5534486
2 5534486
3 5534486
4 5534486
5 5534486

SQL> select checkpoint_change# from v$database;

CHECKPOINT_CHANGE#
------------------
5534486

SQL> select file#,checkpoint_change# from v$datafile_header;

FILE# CHECKPOINT_CHANGE#
---------- ------------------
1 5534486
2 5534486
3 5534486
4 5534486
5 5534486
--
这时发现start scn last scn不等,last scn为无穷大,需要例程恢复

6、改变数据库状态为open,并查看该阶段运行日志
SQL> select * from wen.t;
select * from wen.t
*
ERROR
位于第 1 :
ORA-01219:
数据库未打开: 仅允许在固定表/视图中查询


SQL> alter database open;

数据库已更改。
SQL> select * from wen.t;

A
----------
1
--
发现没有提交的事务丢失。查看日志如下:
Completed: ALTER DATABASE MOUNT
Wed May 17 21:35:46 2006
alter database open
Wed May 17 21:35:46 2006
Beginning crash recovery of 1 threads --
会自动判断是否需要恢复,这里开始例程恢复
Wed May 17 21:35:46 2006
Started first pass scan
Wed May 17 21:35:47 2006
Completed first pass scan
206 redo blocks read, 90 data blocks need recovery
Wed May 17 21:35:47 2006
Started recovery at
Thread 1: logseq 167, block 271, scn 0.0
Recovery of Online Redo Log: Thread 1 Group 2 Seq 167 Reading mem 0 --
恢复用的在线重做日志
Mem# 0 errs 0: D:ORACLEORADATADB1REDO02.LOG
Wed May 17 21:35:47 2006
Ended recovery at
Thread 1: logseq 167, block 477, scn 0.5554724
90 data blocks read, 90 data blocks written, 206 redo blocks read
Crash recovery completed successfully --
恢复完成
Wed May 17 21:35:47 2006
LGWR: Primary database is in CLUSTER CONSISTENT mode
Thread 1 advanced to log sequence 168
Thread 1 opened at log sequence 168
Current log# 3 seq# 168 mem# 0: D:ORACLEORADATADB1REDO03.LOG
Successful open of redo thread 1.
Wed May 17 21:35:48 2006
SMON: enabling cache recovery
Wed May 17 21:35:48 2006
ARC0: Evaluating archive log 2 thread 1 sequence 167
ARC0: Beginning to archive log 2 thread 1 sequence 167
Creating archive destination LOG_ARCHIVE_DEST_1: 'D:DBBKARC00167.001'
ARC0: Completed archiving log 2 thread 1 sequence 167
Wed May 17 21:35:48 2006
Undo Segment 1 Onlined
Undo Segment 2 Onlined
Undo Segment 3 Onlined
Undo Segment 4 Onlined
Undo Segment 5 Onlined
Undo Segment 6 Onlined

原文地址 http://digifish.bokee.com/viewdiary.18440035.html

Part IV. 关于SCN的理解

1.oracle正常运行时,control文件的SCN是个很大的数,与redo log文件、数据文件的SCN不同,正常关闭时,做完checkpoint后,三者的SCN值相同;Biti:日志文件中scn有起始和结束2个(高低),在current log中高scn同样为无穷大。
2.
当一个事务commit成功时,redo log文件中的SCN+1,当该事务所做的修改写入数据文件后,数据文件的SCN+1Biti:commit的时候加1,其他很多时候也会加1,只要数据库发生了变化都会增加。数据写入数据文件时scn不是加1而是由ckpt更新,检查点发生的时候才修改数据文件头的检查点计数并更新scn
3.
疑问:是不是如果一个事务比较大,在事务提交前就发生redo log entriesdata buffer的写入,此时断电,则数据文件、redo log文件的SCN没有+1,且相同,但控制文件SCN不同,数据库startup时发生回滚。Biti:数据文件是由ckpt进程更新文件头的,scn不是加1,而是更新为检查点发生那时的scn,回滚是根据回滚段头的事务表状态来进行的。

4.数据写入数据文件scn不是加1而是ckpt 更新,检查点发生的时候才修改数据文件头的 检查点计数和更新scn 是不是应该这么说?:ckpt 更新时发生数据写入,同时修改数据文件头的 检查点计数和更新scn 。当出现其他情况下的数据写入时(如无空闲缓冲等),不发生ckpt ,但SCN会增加。Biti:这个时候修改的是数据块但不是数据文件头,只有检查点发生的时候才更新数据文件头,也就是说只有ckpt进程更新数据文件头(oracle8以前如果没有ckpt进程就是lgwr更新),dbwr只写数据块。

BTW:看样DBWR只是些数据块,只有CKPT进程才能更新数据文件头;
5.commit
的时候加一,其他很多时候也会加1,只要数据库发生了变化都会增加。很多时候,能否举一些例子Biti: dml一发生即使没有提交也会增加scn, job进程一样产生scn,只要对数据库中文件发生任何的改变都有可能产生scn,SCN: system change number, not system commit number .也就是系统发生变化时所产生的一个时间点

标志。不是提交的标志,只是因为提交也是系统的变化之一而已。

6.Biti:检查点的发生,跟写日志文件是没有必然联系的检查点通知 DBWR 写数据文件,写完后ckpt更新控制文件头和数据文件头。DBWR写数据块的时候若发现数据块的相关 RDBA (位于日志文件的位置) log block 还没有被写入日志文件,则在dbwr写块之前必须通知lgwrlog buffer 中日志写入日志文件。

7.data block 里面的SCN是当 block 被更改的时候的SCN 而数据文件有那么多 block,自然不同的 block有不同的SCN
block
中存在 block SCN ITL 中的commit SCN

block SCN
又在块头和块尾都有,若不一致意味着block损坏(热备可能出现这个情况,需要从redo log中拷贝回来,若是正在修改的过程中由于进程死掉则 pmon负责清理。若 由于一些以外发生这样的不一致的情况,则查询的时候出现 1578 错误,当然该错误号也可能是物理磁盘损坏,这里表示逻辑的损坏!)这个头和尾的SCN的检查时机跟这两个参数有关:
db_block_checking boolean FALSE
db_block_checksum boolean FALSE
2参数信息请查阅 http://tahiti.oracle.com
ITL 中的 commit SCN 则跟 consistent gets and delay block cleanout 有关
数据文件头的 SCN 是检查点发生时更新的代表着 恢复的时候从这个 SCN 开始在 log file 中寻找 redo 开始做恢复

8.According to Rama Velpuri's book, CKPT updates controlfiles, not their headers. It makes sense because if you look at a controlfile dump, the header doesn't even have an SCN. But the file body has sections for each datafile, and therefore each of them has an SCN to be updated.

It's odd that most books and also documentation don't even say CKPT updates controlfiles.

Follow-up to bellsz's original message. In controlfiles, the stop SCN is not a very big number; it's in fact set to infinity when the database is open. Also, SCNs are incremented for many reasons, mostly due to recursive transactions. Read Steve Adams and Hemant Chitale's answers at
http://groups.google.com/groups?sel...t_nospam.com.sg
9.

系统检查点scn(v$database(checkpoint_change#))数据文件检查点(v$datafile(checkpoint_change#)数据文件终止scn(v$datafile(last_change#))
数据文件中存放的检查点启动scn (v$datafile_header(checkpoint_change#)

1>
系统检查点scn当一个检查点动作完成之后,Oracle就把系统检查点的SCN存储到控制文件中。
select checkpoint_change# from v$database
2>
数据文件检查点scn当一个检查点动作完成之后,Oracle就把每个数据文件的scn单独存放在控制文件中。
select name,checkpoint_change# from v$datafile
3>
启动scn
Oracle
把这个检查点的scn存储在每个数据文件的文件头中,这个值称为启动scn因为它用于在数据库实例启动时,检查是否需要执行数据库恢复
select name,checkpoint_change# from v$datafile_header
4>
终止scn每个数据文件的终止scn都存储在控制文件中。
select name,last_change# from v$datafile
在正常的数据库操作过程中,所有正处于联机读写模式下的数据文件的终止scn都为null.
5>
在数据库运行期间的scn在数据库打开并运行之后,控制文件中的系统检查点、控制文件中的数据文件检查点scn和每个数据文件头中的启动scn都是相同的。控制文件中的每个数据文件的终止scn都为null.
在安全关闭数据库的过程中,系统会执行一个检查点动作,这时所有数据文件的终止scn都会设置成数据文件头中的那个启动scn的值。在数据库重新启动的时候,
Oracle
将文件头中的那个启动scn与数据库文件检查点scn进行比较,如果这两个值相互匹配,oracle接下来还要比较数据文件头中的启动scn和控制文件中数据文件的终止scn。如果这两个值也一致,就意味着所有数据块多已经提交,所有对数据库的修改都没有在关闭数据库的过程中丢失,因此这次启动数据库的过程也不需要任何恢复操作,此时数据库就可以打开了。当所有的数据库都打开之后,存储在控制文件中的数据文件终止scn的值再次被更改为null这表示数据文件已经打开并能够正常使用了。

10.

找了一些网页,发现SCN确实不只在事务提交时增加,以下是网页上的摘要:
1)
SCN means "System Change Number" not "System Commit Number".
However, because the SCN is always incremented at commits and seldom otherwise, it is OK to use the two terms interchangeably.
2)
The SCN is incremented whenever a transaction commits. However, this is not the only source of increments. In a seemingly idle database, the SCN gets incremented also through AQ, SMON, job queues...

1
中说了 oracle seldom操作也会引起SCN的增加,2中更明确说了AQ, SMON, job queues... 会导致SCN的增加,因此应该得出结论,ORACLE中除了COMMIT会导致SCN增加外还有其它的ORACLE后台进程会导致SCN增加.
但是,是否是普通的DML导致了SCN的增加,还是由于DML操作过程中后台进程导致了SCN增加的假象?请大家踊跃讨论!还有ORACLE后台进程在何时,何种情况下导致了SCN增加,也请大家踊跃讨论!

Biti:这句话我应该更准确第表达一下如果一个dml导致产生事务,则会产生一个scn。这个意思是说如果一个事务包含多个dml,则只有第一个初始产生事务的dml产生scn,提交的时候又是一个scn如果一个事务只有一个dml,拿看起来就是dml产生一个scn,提交或者回滚产生一个scn这是经过实验测试过的,如果你又兴趣,不紧紧是要找资料看,还可以动手证明。

你可以理解为 begin transaction and commit tansaction
至于没有dmlcommit ,那不叫一个 transaction
你不做任何dml 而发出rollback命令 将会发现 v$sysstat user rollbacks 将会增加 transactions 不会增加
所以你可以把结论定义为 事务的开始 和事务的结束都会导致 SCN 的增加,其他如 AQ/JOB 等也会产生SCN ……同一个block上在一个事务中连续发生255DMLscn也会增加
……

11.sys@DBAP01> select max(ktuxescnw*power(2,32)+ktuxescnb) from x$ktuxe;
MAX(KTUXESCNW*POWER(2

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/13432219/viewspace-1018865/,如需转载,请注明出处,否则将追究法律责任。

上一篇: scn详解(一)
下一篇: scn详解(三)
请登录后发表评论 登录
全部评论

注册时间:2009-04-07

  • 博文量
    7
  • 访问量
    11105