ITPub博客

首页 > 大数据 > 数据挖掘 > 数据库学习笔记

数据库学习笔记

数据挖掘 作者:teretonta 时间:2013-12-02 15:29:09 0 删除 编辑

数据库系统四个基本概念:数据    数据库   数据库管理系统   数据库系统

 

数据是数据库中存储的基本对象    数据的定义:描述事物的符号记录   数据的种类:文字图像图形 声音

 

数据库(Database,简称DB)是长期储存在计算机内、有组织的、可共享的大量数据集合

 

数据库的特:数据按一定的数据模型组织、描述和储存可为各种用户共享冗余度较小数据独立性 较高易扩展

数据库管理系统(Database  Management System,简称DBMS)

DBMS的用途:科学地组织和存储数据、高效地获取和维护数据

 

数据库系统的构成:由数据库、数据库管理系统(及其开发工具)、应用系统、数据库管理员(和用户)构成

 

什么是数据管理:对数据进行分类、组织、编码、存储、检索和维护,是数据处理的中心问题

 

数据库中实现的是数据的真正结构化:
数据的结构用数据模型描述,无需程序定义和解释。
数据可以变长。
数据的最小存取单位是数据项。

(1) 实体(Entity) 客观存在并可相互区别的事物称为实体,可以是具体的人、事、物或抽象的概念。
(2) 属性(Attribute)实体所具有的某一特性称为属性,一个实体可以由若干个属性来刻画。 
(3) 码(Key) 唯一标识实体的属性集称为码。

(4) 域(Domain) 属性的取值范围称为该属性的域。
(5) 实体型(Entity Type) 用实体名及其属性名集合来抽象和刻画同类实体称为实体型
(6) 实体集(Entity Set) 同型实体的集合称为实体集

(7) 联系(Relationship) 
现实世界中事物内部以及事物之间的联系在信息世界
中反映为实体内部的联系和实体之间的联系
实体型间联系
两个实体型                  一对一联系(1:1)  
三个实体型                  一对多联系(1:n)
一个实体型                   多对多联系(m:n) 

 

关系模型(Relational Model)     数据结构:表

面向对象模型(Object Oriented Model)   数据结构:对象

 

======================================================================

======================================================================

满足下面两个条件的基本层次联系的集合为层次模型。
1. 有且只有一个结点没有双亲结点,这个结点称为根结点
2. 根以外的其它结点有且只有一个双亲结点

 

数据库学习笔记

表示方法
实体型:用记录类型描述。
        每个结点表示一个记录类型。
属性:用字段描述。每个记录类型可包含若干个字段。
联系:用结点之间的连线表示记录(类)型之间的 一对多的联系

 

特点
结点的双亲是唯一的
只能直接处理一对多的实体联系
每个记录类型定义一个排序字段,也称为码字段
任何记录值只有按其路径查看时,才能显出它的全部意义
没有一个子女记录值能够脱离双亲记录值而独立存在

 

多对多联系在层次模型中的表示
用层次模型间接表示多对多联系方法
将多对多联系分解成一对多联系
分解方法
冗余结点法
虚拟结点法

 

==================================================

网状模型:满足下面两个条件的基本层次联系的集合为网状模型
1. 允许一个以上的结点无双亲;
2. 一个结点可以有多于一个的双亲。


数据库学习笔记

 

表示方法(与层次数据模型相同)
实体型:用记录类型描述。     每个结点表示一个记录类型。
属性:用字段描述。   每个记录类型可包含若干个字段。
联系:用结点之间的连线表示记录(类)型之间的一对多的父子联系。

 

特点:
只能直接处理一对多的实体联系
每个记录类型定义一个排序字段,也称为码字段
任何记录值只有按其路径查看时,才能显出它的全部意义

 

=======================================================

关系数据模型的数据结构

关系(Relation)
一个关系对应通常说的一张表。
元组(Tuple)
表中的一行即为一个元组。
属性(Attribute)
表中的一列即为一个属性,给每一个属性起一个名称即属性名。

主码(Key)
表中的某个属性组,它可以唯一确定一个元组。
域(Domain)
属性的取值范围。
分量
元组中的一个属性值。
关系模式
对关系的描述
关系名(属性1,属性2,…,属性n)
学生(学号,姓名,年龄,性别,系,年级)

 

型” 和“值” 的概念
型(Type)
对某一类数据的结构和属性的说明
值(Value)
是型的一个具体赋值
例如:学生记录
记录型:
  (学号,姓名,性别,系别,年龄,籍贯)
该记录型的一个记录值:
  (900201,李明,男,计算机,22,江苏)

 

数据库学习笔记

 

 

数据库学习笔记

 

1) 笛卡尔积
给定一组域D1,D2,…,Dn,这些域中可以有相同的。D1,D2,…,Dn的笛卡尔积为:
D1×D2×…×Dn={(d1,d2,…,dn)|diDi,i=1,2,…,n}

所有域的所有取值的一个组合
不能重复

 

例  给出三个域:
   D1=SUPERVISOR ={ 张清玫,刘逸 }  
   D2=SPECIALITY={计算机专业,信息专业}
  D3=POSTGRADUATE={李勇,刘晨,王敏}
则D1,D2,D3的笛卡尔积为:
D1×D2×D3 =
{(张清玫,计算机专业,李勇),(张清玫,计算机专业,刘晨),
    (张清玫,计算机专业,王敏),(张清玫,信息专业,李勇),
    (张清玫,信息专业,刘晨),(张清玫,信息专业,王敏),
    (刘逸,计算机专业,李勇),(刘逸,计算机专业,刘晨),
     (刘逸,计算机专业,王敏),(刘逸,信息专业,李勇),
     (刘逸,信息专业,刘晨),(刘逸,信息专业,王敏) }

 

1) 关系
D1×D2×…×Dn的子集叫作在域D1,D2,…,Dn上的关系,表示为
                 R(D1,D2,…,Dn)
         R:关系名
         n:关系的目或度(Degree)






数据库学习笔记

关系:就是这个二维表;

元组:就是第二行的正行可以看做位一个元组;

属性:每一列都可以成为一个属性,例如学号、姓名、性别.....都可以成为一个属性;

属性值:属性下面填写的值就是属性值;

域:其实就是取值的范围;

表结构:

数据库学习笔记

数据库学习笔记

数据库学习笔记

第一个关系运算是    选择:
数据库学习笔记



数据库学习笔记







 

 


 


 

 

 

 

 

 

 

 

 

 

 

 

 

 


 

<!-- 正文结束 -->

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/21909320/viewspace-1118825/,如需转载,请注明出处,否则将追究法律责任。

上一篇: 没有了~
下一篇: 没有了~
请登录后发表评论 登录
全部评论

注册时间:2009-06-16