ITPub博客

首页 > Linux操作系统 > Linux操作系统 > 浅谈ORACLE的分布式事务

浅谈ORACLE的分布式事务

原创 Linux操作系统 作者:space6212 时间:2019-07-14 19:39:07 0 删除 编辑

简单来说,分布式事务是指涉及到多个数据库的事务。
本文通过例子讨论oracle处理分布式事务的原则及优化方法。

平台环境:
suk: linux as4 + oracle 9201
primary: windows xp + oracle 10.2.0.3


首先在primary数据库上建立测试数据。
SQL> create table test as select * from dba_objects;

Table created.

SQL> insert into test select * from test;

9873 rows created.

SQL> /

19746 rows created.

SQL> /

39492 rows created.

SQL> /

78984 rows created.

SQL> /

157968 rows created.

SQL> /

315936 rows created.

SQL> commit;

Commit complete.

以下操作都是在suk数据库上执行:

先看两个表都在远端的例子:
suk@ORACLE9I> select owner,count(1) from test@primary,dual@primary group by owner;

已选择8行。

已用时间: 00: 00: 00.87

执行计划
----------------------------------------------------------
0 SELECT STATEMENT (REMOTE) Optimizer=ALL_ROWS (Cost=1824 Card
=670910 Bytes=11405470)

1 0 HASH (GROUP BY) (Cost=1824 Card=670910 Bytes=11405470)
2 1 NESTED LOOPS (Cost=1758 Card=670910 Bytes=11405470)
3 2 FAST DUAL (Cost=2 Card=1)
4 2 TABLE ACCESS (FULL) OF 'TEST' (TABLE) (Cost=1756 Card= PRIMARY
670910 Bytes=11405470)


suk@ORACLE9I> select /*+ rule */ owner,count(1) from test@primary,dual@primary group by owner;

已选择8行。

已用时间: 00: 00: 00.89

执行计划
----------------------------------------------------------
0 SELECT STATEMENT (REMOTE) Optimizer=HINT: RULE
1 0 SORT (GROUP BY)
2 1 NESTED LOOPS
3 2 FAST DUAL
4 2 TABLE ACCESS (FULL) OF 'TEST' (TABLE) PRIMARY

以上两个例子可以说明:不管是CBO还是RBO,如果SQL中涉及的表都是远端的,那么该语句在远端执行,在得到结果后返回调用端。
这一点我们可以从执行计划的SELECT STATEMENT (REMOTE)看出。

接着再看两个包含了本地表和远端表的查询:
suk@ORACLE9I> select owner,count(1) from test@primary,dual group by owner;

已选择8行。

已用时间: 00: 00: 03.92

执行计划
----------------------------------------------------------
0 SELECT STATEMENT Optimizer=CHOOSE
1 0 SORT (GROUP BY)
2 1 NESTED LOOPS
3 2 TABLE ACCESS (FULL) OF 'DUAL'
4 2 REMOTE* PRIMARY


4 SERIAL_FROM_REMOTE SELECT "OWNER" FROM "TEST" "TEST"



suk@ORACLE9I> select /*+ rule */ owner,count(1) from test@primary,dual group by owner;

已选择8行。

已用时间: 00: 00: 03.45

执行计划
----------------------------------------------------------
0 SELECT STATEMENT Optimizer=HINT: RULE
1 0 SORT (GROUP BY)
2 1 NESTED LOOPS
3 2 TABLE ACCESS (FULL) OF 'DUAL'
4 2 REMOTE* PRIMARY


4 SERIAL_FROM_REMOTE SELECT "OWNER" FROM "TEST" "TEST"


从以上两个例子可以看出:无论是CBO还是RBO,当查询包含了本地表和远端表时,oracle总是先把远端表的数据通过网络传送到SQL的发起端,再跟本地表进行关联得到最终结果。
从SELECT STATEMENT和SERIAL_FROM_REMOTE SELECT "OWNER" FROM "TEST" "TEST"可以看出SQL是取得远端数据后在本地执行。

同时,要注意一个现象:如果SQL涉及的表都在远端,SQL共耗费不到1秒的时间;而如果一个表在本地,一个表在远端,返回相同的结果SQL耗费时间达到3秒多。
还要注意的是:在这种分布式事务中,看执行计划的资源消耗统计部分是没有意义的,因为本地(SQL的发起端)是不知道远端数据库的资源消耗情况。

到这里,可能很多人都会想到:如果本地表很小,远端表(准确来说是数据源)很大,且返回结果比较少的情况下,将远端表(大表)传送到本地将会引起很大的资源消耗。
很明显,要解决这样的问题,最好是把本地表数据传送到远端,然后让SQL在远端执行,得到结果后再返回到SQL发起端。
幸运的是,oracle提供一个hint来应对这种情况:driving_site

下面我们用这个hint来测试一下:
suk@ORACLE9I> select /*+ driving_site(test) */owner,count(1) from test@primary,dual group by owner;

已选择8行。

已用时间: 00: 00: 01.25

执行计划
----------------------------------------------------------
0 SELECT STATEMENT (REMOTE) Optimizer=ALL_ROWS (Cost=8404591 C
ard=5479992102 Bytes=93159865734)

1 0 HASH (GROUP BY) (Cost=8404591 Card=5479992102 Bytes=931598
65734)

2 1 MERGE JOIN (CARTESIAN) (Cost=7524913 Card=5479992102 Byt
es=93159865734)

3 2 TABLE ACCESS (FULL) OF 'TEST' (TABLE) (Cost=1756 Card= PRIMARY
670910 Bytes=11405470)

4 2 BUFFER (SORT) (Cost=8402834 Card=8168)
5 4 REMOTE* OF 'DUAL' (REMOTE) (Cost=11 Card=8168) !


5 SERIAL_FROM_REMOTE SELECT 0 FROM "SYS"."DUAL" "A1"


suk@ORACLE9I> select /*+ rule driving_site(test) */ owner,count(1) from test@primary,dual group by o
wner;

已选择8行。

已用时间: 00: 00: 00.71

执行计划
----------------------------------------------------------
0 SELECT STATEMENT (REMOTE) Optimizer=HINT: RULE
1 0 SORT (GROUP BY)
2 1 NESTED LOOPS
3 2 REMOTE* OF 'DUAL' (REMOTE) !
4 2 TABLE ACCESS (FULL) OF 'TEST' (TABLE) PRIMARY


3 SERIAL_FROM_REMOTE SELECT 0 FROM "SYS"."DUAL" "A1"

注意SELECT STATEMENT (REMOTE)和SERIAL_FROM_REMOTE SELECT 0 FROM "SYS"."DUAL" "A1"与之前的测试例子的变化。

从上面两个例子可以看出:用了driving_site后,oracle将在该hint指定的数据库上执行SQL,然后在把结果返回给SQL的发起端。这个HINT对CBO和RBO都适用。

简单总结一下:
1、不管是CBO还是RBO,如果SQL中涉及的表都是远端的,那么该语句在远端执行,在得到结果后返回调用端。
2、无论是CBO还是RBO,当查询包含了本地表和远端表时,oracle总是先把远端表的数据通过网络传送到SQL的发起端,再跟本地表进行关联得到最终结果。
3、可以通过driving_site这个hint来执行SQL在那端执行。这个hints在某些特定条件下的分布式查询调优非常有用。

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/231499/viewspace-63831/,如需转载,请注明出处,否则将追究法律责任。

请登录后发表评论 登录
全部评论

注册时间:2005-01-25

  • 博文量
    245
  • 访问量
    166269