ITPub博客

首页 > Linux操作系统 > Linux操作系统 > Oracle Warehouse Builder 11g 入门之使用平面文件事务数据

Oracle Warehouse Builder 11g 入门之使用平面文件事务数据

原创 Linux操作系统 作者:idba 时间:2008-03-28 10:06:14 0 删除 编辑

目的
平面文件是数据仓库项目的一种典型数据源。在本教程中,您将学习如何创建平面文件源模块。模块是项目中的存储对象,它们可帮助您以逻辑方式对源和目标对象定义进行分组。源模块保存的元数据用于描述源系统,您将从这些源系统中提取数据。目标模块保存的元数据则用于描述目标数据仓库或数据集市。

平面文件源模块定义了与包含一些平面文件示例的文件夹的连接。您将学习如何使用向导将平面文件元数据导入到平面文件源模块中。除了上机操作平面文件源之外,您还将看到一个有关 OWB 如何处理关系表数据库源的演示。


注: 本教程及其设置脚本仅支持 OWB 11g 第 1 版。该 Oracle 示例教程的早期版本可用于 OWB 10g 第 1 版和第 2 版。

主题
本教程包括下列主题:

 概述
 前提条件
 创建平面文件源模块 
 导入平面文件元数据
 检查 Oracle 数据库模块 
 总结

概述

Warehouse Builder 需要元数据来描述产品中使用的源对象。为此,您要将源组织到一些称为模块的特定的元数据组中。模块引用 OS 目录或数据库模式。因此必须首先创建平面文件模块,然后再导入源中的元数据。无论对于文件还是模式中的表,要完成上述目的的过程都是相似的。

本教程主要讲述了如何定义一个存储平面文件元数据的源模块。 您将学习如何使用 Import Metadata Wizard 来选择希望导入的平面文件,以及如何使用 Flat File Sample Wizard 来检查和记录平面文件的元数据。Flat File Sample Wizard 用于存储在 Warehouse Builder 库中定义的元数据。另外,在屏幕截图和说明的帮助下,您将了解如何检查 Oracle 数据库源模块。

 

开始学习本教程之前,您应已经:

1.

下载了 owbdemo_files.zip 文件,并将该文件解压缩到一个驱动器上,如您计算机硬盘的 D 盘

2.

完成了教程 1,继续以 rep_owner/rep_owner 用户身份登录

 

创建平面文件源模块

在本主题中,您将学习如何创建平面文件模块,之后您会向其中添加描述平面文件源的元数据。您现在创建的源模块最终将保存特定于平面文件的元数据;因此,此模块位于 Warehouse Builder Project Explorer 的 Files 节点中。

1.

您已经以 rep_owner/rep_owner 用户身份登录到 Design Center 中。展开 Project Explorer 面板中的 OWB_DEMO 项目。右键单击 Files 节点,然后选择 New

将鼠标置于该图标上可以查看该图像

出现 Create Module Wizard:Welcome 页。单击 Next

将鼠标置于该图标上可以查看该图像

出现 Create Module Wizard:Name and Description 页。

2.

在 Create Module Wizard:Name and Description 页中,输入 SOURCE 作为该模块的名称。单击 Next

将鼠标置于该图标上可以查看该图像

出现 Create Module Wizard:Connection Information 页。在平面文件源模块中,位置是指平面文件所在的文件系统中的路径或目录。

3.

在 Create Module Wizard:Connection Information 页中,OWB 创建一个默认的位置,即 SOURCE_LOCATION1。单击 Edit

将鼠标置于该图标上可以查看该图像

出现 Edit File System Location:SOURCE_LOCATION1 窗口。

4.

在 Edit File System Location:SOURCE_LOCATION1 窗口中,将默认名称 SOURCE_LOCATION1 重命名为 SOURCE_LOCATION。单击 Browse

将鼠标置于该图标上可以查看该图像

在 Browse Directory 窗口中,选择 D:\newowbdemo\sourcefiles 或者您在其中保存安装脚本的驱动器和目录(包含有源文件夹)。单击 Select

5.

在 Edit File System Location:SOURCE_LOCATION1 窗口中检查路径,然后单击 OK

将鼠标置于该图标上可以查看该图像

6.

在 Connection Information 窗口中,请确保选择了 Import after finish。选择此选项将启动 Import Metadata Wizard。单击 Next

提示:如果未选择该复选框,则 Import Metadata Wizard 不会自动启动。要手动启动 Import Metadata Wizard,在 Project Explorer 中展开 Files,右键单击 SOURCE 模块,然后选择 Import

将鼠标置于该图标上可以查看该图像

出现 Create Module:Summary 页。

7.

在 Summary 页中检查模块设置。单击 Finish

将鼠标置于该图标上可以查看该图像

此时,平面文件模块的定义已完成。Import Metadata Wizard 向导自动启动。如果您暂时将该向导移至一侧,您可以在 Design Center 中看到,在 Project Explorer 的 Files 节点中已经创建了该源模块。

 

导入平面文件元数据

创建了平面文件模块之后,您就可以将平面文件定义导入到 Warehouse Builder 中了。Import Metadata Wizard 将指导您完成导入元数据对象的全部过程。每次使用 Import Metadata Wizard 从现有平面文件导入元数据时,Import Metadata Wizard 都会启动 Flat File Sample Wizard。使用 Flat File Sample Wizard 可检查并记录平面文件的元数据。

使用 Import Metadata Wizard

使用 Flat File Sample Wizard

 

使用 Import Metadata Wizard

1.

在 Import Metadata Wizard:Welcome 页中,单击 Next

将鼠标置于该图标上可以查看该图像

出现 Import Metadata Wizard:Filter Information 页。

2.

在 Import Metadata Wizard:Filter Information 页中,接受默认选择 All Data Files,单击 Next

将鼠标置于该图标上可以查看该图像

此时出现 Import Metadata Wizard:Object Selection 页。

3.

在 Import Metadata Wizard:Object Selection 页中,展开 D:\newowbdemo\sourcefiles 节点(或您在教程 1 中将安装文件解压缩到的其他任何位置)。显示文件列表。使用 >> (Add All) 将 Available 列表中的所有文件定义移至 Selected 列表。单击 Next

将鼠标置于该图标上可以查看该图像

出现 Import Metadata Wizard:Summary and Import 页。

4.

注: 在此页中,您会看到两个前面带有红色叉号的文件定义(expense_categories_csv 和 export_csv)。红色叉号表示在 Warehouse Builder 库中没有此文件可用的元数据信息。导入之前,Warehouse Builder 需要了解这些文件的结构。通过该抽样过程,系统收集到了有关结构的信息。

在 Import Metadata Wizard:Summary and Import 页中,选择 expense_categories_csv 文件(如果尚未选择)。单击 Sample

将鼠标置于该图标上可以查看该图像

出现 Flat File Sample Wizard。

使用 Flat File Sample Wizard

1.

Flat File Sample Wizard 将引导您完成平面文件结构的定义。在 Flat File Sample Wizard:Welcome 页中,单击 Next

将鼠标置于该图标上可以查看该图像

出现 Flat File Sample Wizard:Name 页。

2.

在 Flat File Sample Wizard:Name 页中,接受 EXPENSE_CATEGORIES_CSV 作为默认文件名。这是 Warehouse Builder 在该文件导入之后引用该文件时使用的名称。Warehouse Builder 提供了大量可用于读取数据的字符集。

接受此页上的默认值。此文件有 2 列:Expense Type 和 Expense Categories。此向导对该平面文件的结构作出假设。该对话框的下半部分显示了 OWB 如何将几行平面文件数据导入表列的示例。单击 Next

将鼠标置于该图标上可以查看该图像

出现 Flat File Sample Wizard:Record Organization 页。

3.

注:使用 Record Organization 页可指定记录在抽样文件中的组织方式。

在 Flat File Sample Wizard:Record Organization 中,接受以回车 () 分隔记录的默认选项。单击 Next

将鼠标置于该图标上可以查看该图像

出现 Flat File Sample Wizard:File Format 页。

4.

注: 您需要在此页上指定文件结构的格式。系统支持固定长度的文件和字符分隔文件。

提示: 如果您的文件具有不同的分隔符,您可以在 Field Delimiter 下拉列表中输入它。Warehouse Builder 使用您输入的分隔符。

在 Flat File Sample Wizard:File Format 页中,接受文件格式的 Delimited 默认选项。单击 Next

将鼠标置于该图标上可以查看该图像

出现 Flat File Sample Wizard:File Layout 页。

5.

注: 您可以在此页中指定跳过的行数。对于记录类型,您可以选择单个记录或多个记录。

在 Flat File Sample Wizard:File Layout 页中,接受 Skip Rows 的默认值 0。Expense_categories.csv 文件是单个记录类型文件的示例。为记录类型选择 Single Record,然后单击 Next

将鼠标置于该图标上可以查看该图像

出现 Flat File Sample Wizard:Field Properties 页。

6.

如果平面文件的第一个记录是标题,则可以使用第一个记录中的值作为字段名称。在 Flat File Sample Wizard:Field Properties 页中,选择 Use the first record as the field names

将鼠标置于该图标上可以查看该图像

注意下面屏幕截图中的字段名称已经更改。

提示:注意右侧的 SQL 数据类型,通过这些数据类型,您可以根据此文件控制外部表数据类型等内容。

单击 Next

将鼠标置于该图标上可以查看该图像

出现 Flat File Sample Wizard:Summary 页。

7.

检查为文件 expense_categories_csv 定义的规格汇总。在 Flat File Sample Wizard:Summary 页中,单击 Finish

将鼠标置于该图标上可以查看该图像

向导创建平面文件。Flat File Sample Wizard 会带您返回 Import Metadata Wizard。

8.

在 Import Metadata Wizard:Summary and Import 页中,expense_categories_csv 的 Status 字段中的绿色对号表示 expense_categories_csv 已经过抽样。

将鼠标置于该图标上可以查看该图像

现在,您将继续抽样第二个平面文件。

9.

选择 export_csv 文件(如果尚未选择)。单击 Sample

提示:为了节省时间,您可以在 Same As 下拉列表中选择 Same As <文件名 >。(当要抽样的文件的结构与前面抽样过的任何一个文件相似时,必须使用 Same As 选项)。在此示例中,要抽样的两个文件的结构不相似。

将鼠标置于该图标上可以查看该图像

出现 Flat File Wizard:Welcome 页。单击 Next

10.

在 Flat File Sample Wizard:Name 页中,接受 EXPORT_CSV 作为默认文件名。这是 Warehouse Builder 在该文件导入之后引用该文件时使用的名称。

接受此页上的默认值。此文件有 14 列。单击 Next

将鼠标置于该图标上可以查看该图像

出现 Flat File Sample Wizard:Record Organization 页。

11.

注: 使用 Record Organization 页可指定记录在抽样文件中的组织方式。

在 Flat File Sample Wizard:Record Organization 中,接受以回车 () 分隔记录的默认选项。单击 Next

将鼠标置于该图标上可以查看该图像

出现 Flat File Sample Wizard:File Format 页。

12.

注: 您需要在此页上指定文件结构的格式。系统支持固定长度的文件和字符分隔文件。

在 Flat File Sample Wizard:File Format 页中,接受文件格式的 Delimited 默认选项。单击 Next

将鼠标置于该图标上可以查看该图像

出现 Flat File Sample Wizard:File Layout 页。

13.

注: 您可以在此页中指定跳过的行数。对于记录类型,您可以选择单个记录或多个记录。

在 Flat File Sample Wizard:File Layout 页中,接受 Skip Rows 的默认值 0。export.csv 文件是单个记录类型文件的示例。为记录类型选择 Single Record,然后单击 Next

将鼠标置于该图标上可以查看该图像

出现 Flat File Sample Wizard:Field Properties 页。

14.

在 Flat File Sample Wizard:Field Properties 页中,选择 Use the first record as the field names。如果平面文件的第一个记录是标题,则可以使用第一个记录中的值作为字段名称。

将鼠标置于该图标上可以查看该图像

请注意,此时字段名称已经更改。

将鼠标置于该图标上可以查看该图像

15.

注: 除非您已完成了步骤 15,否则不要单击向导页上的 Back 按钮。这可能会导致错误,原因在于日期是一个保留字,而您还没有重命名日期字段。

在 Flat File Sample Wizard:Field Properties 页中,选择 Date。

因为 Date 是保留字,所以需要将 Date 重命名为 Expense_Date

在 Type 下拉列表中选择 Date。在 Mask 列中,键入 dd-mon-yy(不带单引号)。

将鼠标置于该图标上可以查看该图像

16.

在 Flat File Sample Wizard:Field Properties 页中,选择 Reimbursable_Amount_(USD)。

因为“(”和“)”都是保留字符,所以将 Reimbursable_Amount_(USD) 重命名为 Reimbursable_Amount。

在 Type 下拉列表中选择 Decimal External

将鼠标置于该图标上可以查看该图像

注: 滚动到该对话框的右侧,查看 SQL Properties。向导根据您在 Tpe 列中的选择创建默认的 SQL Properties。

将鼠标置于该图标上可以查看该图像

单击 Next。出现 Flat File Sample Wizard:Summary 页。

17.

检查为文件 EXPORT_CSV 定义的规格汇总。在 Flat File Sample Wizard:Summary 页中,单击 Finish

将鼠标置于该图标上可以查看该图像

向导创建平面文件。Flat File Sample Wizard 会带您返回 Import Metadata Wizard。

18.

在 Import Metadata Wizard Summary and Import 页中,EXPENSE_CATEGORIES_CSV 和 EXPORT_CSV 的 Status 字段中的绿色对号表示两个文件均已经过抽样。在 Import Metadata Wizard:Summary and Import 页中,单击 Finish

此时导入过程开始。Importing Progress 对话框显示了导入进度。

将鼠标置于该图标上可以查看该图像

在 Project Explorer 中展开 Files > SOURCE。您将看到刚刚抽样并导入的两个表(EXPENSE_CATEGORIES_CSV 和 EXPORT_CSV)。

将鼠标置于该图标上可以查看该图像

在 Design Center 中,单击工具栏上的 Save All 。在 Warehouse Builder Warning 窗口中,单击 Yes 提交您的工作。

 

检查 Oracle 数据库模块

除平面文件元数据源之外,您将创建一个用于各种其他源的模块,如用于基于 Oracle 的关系表源元数据的模块。涵盖的主题假定您的源数据已经以平面文件的形式存在。

在该子主题中,您将阅读一个有关如何从 Oracle 源中导出数据的演示。在本示例中,您将从一个 Oracle 数据库的模式中导出数据,该模式中存储有 HR 数据。下面的步骤仅供了解,无需执行。在说明和屏幕截图的帮助下,您能够理解这些概念。

1.

请再次注意:
下面的步骤仅供了解,无需执行

在这一步,您将了解如何创建 Oracle 模块。在 Project Explorer 中,展开项目 OWB_DEMO > Databases。右键单击 Oracle,选择 New。在 Create Module -Welcome 页中,单击 Next

将鼠标置于该图标上可以查看该图像

在 Create Module Wizard:Name and Description 页中,输入 HR 作为 Oracle 数据源模块的名称。模块类型是 Data Source。单击 Next

将鼠标置于该图标上可以查看该图像

2.

向导的下一页是 Connection Information 页。OWB 为每一个已创建的模块创建一个位置名。正如您在屏幕截图中所看到的,位置名是 HR_LOCATION1。位置特定于 Oracle 数据库或平面文件等模块类型。

将鼠标置于该图标上可以查看该图像

3.

单击 Edit 启动 Edit Oracle Database Location 页。在 Edit Oracle Database Location 页中,将默认的位置 HR_LOCATION1 重命名为 HR_LOCATION。您还要提供连接信息(用户名、口令、主机、端口和服务名),它们用于指定元数据的源。在本示例中,提供的连接详细信息用于连接到 HR 模式。

提示: 您可以使用各种连接类型:

HOST:PORT:SERVICENAME

Database Link

SQL*NET Connection

这使您能够在使用 TNS NAMES 条目的地方进行这样的配置(例如,针对 RAC),并且无需引用直接的单个节点。

单击 Test Connection。您提供的连接信息已经过测试,连接成功后将显示“Successful”消息。单击 OK

将鼠标置于该图标上可以查看该图像

4.

在 Connection Information 页中,确保已选择 Import after finish 选项,进入 Import Metadata Wizard。

将鼠标置于该图标上可以查看该图像

单击 Next。在 Summary 页中,单击 Finish

将鼠标置于该图标上可以查看该图像

出现 Import Metadata Wizard Welcome 页。单击 Next

5.

利用 Import Metadata Wizard,您可以将元数据从数据库导入到模块中。选择您想导入到 HR Oracle 源模块中的对象。

在 Filter Information 页中,选择您想要导入的对象类型。

将鼠标置于该图标上可以查看该图像

单击 Next。在 Object Selection 页中,选择您想要导入的具体对象。

将鼠标置于该图标上可以查看该图像

Warehouse Builder 将导入包括约束(如果存在的话)在内的所有定义。在本示例中,您选择了 COUNTRIES 表,Warehouse Builder 识别了通过一个外键关联的 REGIONS 表。在 Confirm Import Selection 对话框中,单击 OK 导入相关的 REGIONS 表。单击 Next

6.

在 Summary and Import 页中,验证您已选择要导入 Warehouse Builder 的所有对象。您可以编辑对象的描述字段。

将鼠标置于该图标上可以查看该图像

单击 Advanced Import Options 检查各个导入选项,如屏幕截图所示。

将鼠标置于该图标上可以查看该图像

单击 OK。单击 Finish。在 Import Results 页中,单击 OK

您现在已经完成了 Oracle 数据库定义的导入。 在 Oracle Warehouse Builder 客户端中,检查导入的元数据。展开 HR 模块并检查为表导入的元数据。

将鼠标置于该图标上可以查看该图像

 

在本教程中,您学习了如何:

创建平面文件源模块。文件模块定义了与包含一些平面文件示例的文件夹的连接。

为创建平面文件的定义,使用了:

Import Metadata Wizard 来导入平面文件

Flat File Sample Wizard 来对平面文件进行抽样

简要检查 Oracle 数据库模块

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/1384/viewspace-219066/,如需转载,请注明出处,否则将追究法律责任。

请登录后发表评论 登录
全部评论

注册时间:2008-03-25

  • 博文量
    210
  • 访问量
    394116