数据库原理与实践(Access版)
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.4 客观世界的数据表示

数据从现实世界到计算机数据库的抽象表示经历了三个阶段,即现实世界、概念世界、数据世界,如图1.7所示。

图1.7 数据抽象三阶段

1.4.1 现实世界

现实世界里的客观事物是我们进行管理的对象,这些对象之间既有区别,也有联系。这种区别和联系取决于事物本身的特性。

1.4.2 概念世界

概念世界是现实世界在人脑中的反映,是对客观事物及其联系的抽象,概念世界也称为信息世界。

1.概念世界的基本概念

(1)实体、实体集和实体型

客观存在并可相互区别的事物称为实体。实体可以是具体的人、事、物,也可以是抽象的概念或联系。例如,一个学生、一门课、一个供应商、一个部门、一本书、一位读者等都是实体。

同型实体的集合称为实体集。例如,全体学生就是一个实体集。图书馆的图书也是一个实体集。

具有相同属性的实体必然具有共同的特征和性质。用实体名及其属性名集合来抽象和描述同类实体,称为实体型。例如,学生(学号、姓名、性别、出生年月、系别、入学时间)就是一个实体型。图书(编号、书名、出版社、出版日期、定价)也是一个实体型。

(2)属性、域和主码

实体所具有的某一特性称为属性。一个实体可以由若干属性来描述。例如,图书实体可以由编号、书名、出版社、出版日期、定价等属性组成。又如,学生实体可以由学号、姓名、性别、出生年月、系别、入学时间等属性组成。如(2010119120、王丽、女、1992-12-28、计算机系、2010),这些属性组合起来体现了一个学生的特征。

属性的取值范围称为该属性的域。例如,职工性别域为(男、女),姓名域为字母字符串集合,年龄域为小于150的整数,职工号域为5位数字组成的字符串等。

唯一标识实体的属性集称为主码。例如,学生学号是学生实体的主码,职工号是职工实体的主码。

(3)联系

在现实世界中,事物内部以及事物之间是有联系的,这些联系在信息世界中反映为实体内部的联系和实体之间的联系。实体内部的联系通常是组成实体的各属性之间的联系,两个实体型之间的联系可以分为3类。

① 一对一联系(1:1)

如果对于实体集A中的每一个实体,实体集B至多有一个实体与之联系,反之亦然,则称实体集A与实体集B具有一对一联系,记为1:1。

例如,某宾馆只有单人间,每个客房都对应着一个房间号,一个房间号也唯一地对应着一间客房。所以,客房和房间号之间具有一对一联系。再例如,乘客和座位之间存在一对一联系,意味着一个乘客只能坐一个座位,而一个座位只能被一个乘客占有,如图1.8所示。

② 一对多联系(1:n

如果对于实体集A中的每一个实体,实体集B中有n个实体与之联系(n≥0),反之,对于实体集B中的每一个实体,实体集A中至多有一个实体与之联系,则称实体集A与实体集B具有一对多联系,记为1:n

例如,一个部门中有若干名职工,而每个职工只能在一个部门工作,则部门与职工之间具有一对多联系,如图1.9所示。

图1.8 一对一联系

图1.9 一对多联系

③ 多对多联系(mn

如果对于实体集A中的每一个实体,实体集B中有n个实体与之联系(n≥0),反之,对于实体集B中的每一个实体,实体集A中也有m个实体与之联系(m≥0),则称实体集A与实体集B具有多对多联系,记为mn

图1.10 多对多联系

在选课系统中,一门课程同时有若干个学生选修,而一个学生可以同时选修多门课程,则课程与学生之间具有多对多联系,如图1.10所示。

实际上,一对一联系是一对多联系的特例,而一对多联系又是多对多联系的特例。实体集之间的这种一对一、一对多、多对多联系不仅存在于两个实体集之间,也存在于两个以上的实体集之间。

在授课系统中,对于课程、教师与参考书三个实体型,如果一门课程可以有若干个教师讲授,使用若干本参考书,而每一个教师只讲授一门课程,每一本参考书只供一门课程使用,则课程与教师、课程与参考书之间的联系是一对多的。

同一个实体集内的各实体之间也可以存在一对一、一对多、多对多的联系。职工实体集内部有领导与被领导的联系。即某职工为部门领导,领导若干职工,而一名职工仅被另外一个职工(领导)直接领导,因此这是一对多联系。

2.概念世界的表示

概念模型用于信息世界的建模,与具体的DBMS无关。为了把现实世界中的具体事物抽象、组织为某一DBMS支持的数据模型,人们常常首先将现实世界抽象为概念世界,然后再将概念世界转换为机器世界。实际上,概念模型是现实世界到机器世界的一个中间层次。概念模型从用户的观点出发,将管理对象的客观事物及他们之间的联系,用容易为人所理解的语言或形式表述出来。概念模型应该能够准确、方便地表示概念世界,E-R图(实体联系图)是描述概念模型的主要工具。如图1.11所示描述了学生实体集和课程实体集的E-R图。

图1.11 学生和课程的E-R图

1.4.3 数据世界

数据世界是信息世界进一步数据化的结果,数据世界主要有以下基本术语。

① 数据项。数据项又称字段,是数据库数据中的最小逻辑单位,用来描述实体的属性。

② 记录。记录是数据项的集合,一个记录由若干个数据项组成,用来描述实体。

③ 文件。文件是一个具有文件名的一组同类记录的集合,用来描述实体集。

三种世界的概念对应关系如图1.12所示。

图1.12 三种世界的概念对应关系