ITPub博客

首页 > Linux操作系统 > Linux操作系统 > 有关oracle数据库us7ascii字符集转换策略的探讨

有关oracle数据库us7ascii字符集转换策略的探讨

原创 Linux操作系统 作者:dayspring2chen 时间:2012-02-01 13:21:56 0 删除 编辑

1.    背景

Oracle技术咨询部提供的《********工程-字符集转换策略》文档中,提到通过dblink进行跨库US7ASCIIAL32UTF8转换的方法,本文将对该方式进行验证,并针对该方法提出一些修正思路。

Oracle提出的方法关键点如下:

 eq \o\ac(,1)1.在源端创建视图,针对包含中文的varchar2列进行utl_raw.cast_to_raw操作

 eq \o\ac(,2)2在目标端的sql语句中,针对该列进行utl_raw.cast_to_varchar2操作

 

针对该方法,有以下方面的疑问及担心:

 eq \o\ac(,1)1源端链接用户的权限问题。该方法需要有维护视图(create viewdrop viewalter view)的权限。由于数据迁移是一个相对较长时间的过程,且牵涉到运维商、安全等方面的要求,该权限获取可能存在一定困难。

 eq \o\ac(,2)2灵活性不佳。由于需要对任何表的中文进行查询时都需要创建或重建视图,可能影响数据迁移的工作;目标端也要进行大量的utl_raw.cast_to_varchar2操作,使目标端的转换程序冗长臃肿。

 eq \o\ac(,3)3数据类型限制。Oracleraw数据类型存储的限制为2000char数据类型存储的限制为2000varchar2的数据类型存储限制为40001位的varchar2对应几位的raw varchar2(2000)以上的字段转换为raw是否会发生溢出,是我们需要验证的方面。

2.    验证

2.1环境准备

1.在源端(US7ASCII)建表和视图

create table TEST_ZWZH_1

(

   ID                   char(1)               not null,

   NAME                 varchar2(200),

   CSRQ                 date,

   JL                   varchar2(4000),

   constraint PK_TEST_ZWZH_1 primary key (ID)

);

 

comment on table TEST_ZWZH_1 is

'人员信息';

 

comment on column TEST_ZWZH_1.ID is

'人员id';

 

comment on column TEST_ZWZH_1.NAME is

'人员姓名';

 

comment on column TEST_ZWZH_1.CSRQ is

'出生日期';

 

comment on column TEST_ZWZH_1.JL is

'简历';

 

create table TEST_ZWZH_2

(

   ID                   char(1)               not null,

   NY                   varchar2(6)          not null,

   CQTS                 number,

   GZFFRQ               date,

   GZ                   number,

   constraint PK_TEST_ZWZH_2 primary key (ID, NY)

);

 

comment on table TEST_ZWZH_2 is

'工资发放信息';

 

comment on column TEST_ZWZH_2.ID is

'人员id';

 

comment on column TEST_ZWZH_2.NY is

'发薪年月';

 

comment on column TEST_ZWZH_2.CQTS is

'出勤天数';

 

comment on column TEST_ZWZH_2.GZFFRQ is

'工资发放日期';

 

comment on column TEST_ZWZH_2.GZ is

'工资金额';

 

create or replace view v_test_zwzh_1 as

select id,utl_raw.cast_to_raw(name) raw_name,csrq,utl_raw.cast_to_raw(jl) raw_jl

from test_zwzh_1;

 

2.在目标端(ZHS16GBK)建立数据库链

-- Create database link

create database link DB_HIS_LINK

  connect to USER_AA identified by ‘xxx’

  using 'TNS***';

3.验证少量中文的情况下是否能正常转换

在源端执行插入语句:

insert into test_zwzh_1(id,name,csrq,jl) values('1','张三',to_date('19810101','yyyymmdd'), 'zqw qw');

  在目标端执行查询:

SQL> select id,utl_raw.cast_to_varchar2(raw_name),csrq,utl_raw.cast_to_varchar2(raw_jl) from v_test_zwzh_1@db_his_link;

 

ID UTL_RAW.CAST_TO_VARCHAR2(RAW_N                                                   CSRQ        UTL_RAW.CAST_TO_VARCHAR2(RAW_J

-- -------------------------------------------------------------------------------- ----------- --------------------------------------------------------------------------------

张三                                                                             1981/1/1    zqw qw

 

此种情况下能够正常转换。

4.验证超过2000以上的varchar2是否能正常转换raw

在源端上执行如下语句

SQL> declare

  2     v_text varchar2(4000) ;

  3    begin

  4    for i in 1..201 loop

  5      v_text:=v_text||'123z';

  6    end loop;

  7      update test_zwzh_1 set jl=v_text;

  8      commit;

  9  end;

 10  /

PL/SQL procedure successfully completed.

SQL> select lengthb(jl),length(jl) from test_zwzh_1;

 

LENGTHB(JL) LENGTH(JL)

----------- ----------

       2010       2010

PL/SQL procedure successfully completed.

 

SQL> select * from v_test_zwzh_1;

select * from v_test_zwzh_1

                          *

ERROR at line 1:

ORA-06502: PL/SQL: numeric or value error: raw variable length too long

ORA-06512: at "SYS.UTL_RAW", line 224

可见受制于raw的限制,超过2000以上的varchar2字段,转换时将面临问题.这种情况将直接导致采用视图方案的不可用。

3.    修正方案

分析该方案的要点,可以认为主要在以下方面:

 eq \o\ac(,1)1以源端的环境执行utl_raw.cast_to_raw

 eq \o\ac(,2)2用视图的方式进行结果集的传递

 eq \o\ac(,3)3目标端执行utl_raw.cast_to_varchar2

 

基于上述要点及进行的疑问分析,提出如下修正方案:

1.源端和目标端只部署存储过程(package

2.源端链接用户只需要select table权限

3.源端用动态sql替代原方案的视图

4.源端和目标端用对象数组传递数据集,替代原方案中的视图

5.源端对中文字段进行substrutl_raw.cast_to_raw操作,确保转换成功

6.目标端对回传回来的同一中文raw字段进行utl_raw.concat,utl_raw.cast_to_varchar2操作,组装复原成中文字段。

7.目标端以表函数的方式提供查询参数接收及结果集返回。支持多表连接操作。

8.表函数可以封装为子查询,用于数据迁移工具的二次使用。

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/26662896/viewspace-715415/,如需转载,请注明出处,否则将追究法律责任。

上一篇: 没有了~
下一篇: 没有了~
请登录后发表评论 登录
全部评论

注册时间:2012-02-01

  • 博文量
    1
  • 访问量
    4003