范式原理笔记

什么是(范式)—范式介绍

官方介绍,数据库中的关系是要满足一定要求的,满足不同程度要求的为不同范式。满足最低要求的叫第一范式,简称1NF;在第一范式中满足进一步要求的为第二范式,其余的一次类推。
还不懂?
那么简单来说范式是一种标准,也就是你设计表结构是要符合规范。就好像是你装修自己的房子,你按照的标准越高,那么你的房子就更加的牢固安全。

所谓“第几范式”原本就是表示关系的某一级别,所以常称为某一关系模式R为第几范式。把这个范式这个概念理解为符合某一种级别的关系模式的集合,即R为第几范式就可以写为R∈xNF
对各种范式之间的关系有:5NF⊂4NF⊂BCNF⊂3NF⊂2NF⊂1NF

一个低一级范式的关系模式通过模式分解可以转换为
第一范式、第二范式、第三范式、BCNF(BC范式)

范式发展

(此部分可忽略)
有关范式理论的研究主要是E.F.Codd做的工作。1971-1972年Codd系统的提出了1NF、2NF、3NF的概念,讨论了规范化的问题。1974年,Codd和Boyce共同提出了一个新范式,即BCNF。1976年Fagin提出了4NF。后来又有研究人员提出5NF。

1、第一范式

第一范式是最基本的标准,作为一个二维表,要符合的最基本的条件:每一个分量必须是不可再分的数据项。满足了这个条件的关系模式就属于第一范式。
我们从一个表来理解一下第一范式的意思:
表1:
第一范式、第二范式、第三范式、BCNF(BC范式)这里表一是不符合第一范式的,第范式规定:第一范式的所有属性都不能再分。这里进货这一属性又分为数量和单价。
那么该怎么测能使这个表符合第一范式那?我们只需要将进货属性与其子属性变成两个属性即可。
表2:
第一范式、第二范式、第三范式、BCNF(BC范式)

eg:
建立一个描述学校教务的数据库,该数据库设计对象包括学生学号(Sno)、所在系、系主任姓名、课程号和成绩。利用一个单一的关系模式Student来表示,则该关系模式的属性集合为
U={Sno,Sdept,Mname,Cno,Grade}

  1. 一个系有若干学生,但是一个学生只属于一个系。
  2. 一个系只有一个负责人。
  3. 一个学生可以选修很多门课,每门课程与若干学生选修。
  4. 每个学生学习每门课程有一个成绩。

于是得到属性组U上的一组函数依赖F。
F={Sno->Sdept,Sdept->Mname,(Sno,Cno)->Grade}
如只考虑函数依赖一种数据依赖,可得到一个描述学生的关系模式Student<U,F>。表3则是关系模式Student的一个实例。


表3:
第一范式、第二范式、第三范式、BCNF(BC范式)
但是,这个关系模式存在数据冗余、更新异常、插入异常和删除异常的问题。

  • 数据冗余
    系主任的姓名大量出现,重复的次数与该系学生所有课程成绩出现次数相同。
  • 更新异常
    因为数据冗余所以,系统要付出大量的代价来维护数据库的完整性。同时如果要更改系主任,需要更改该系中每一个学生的信息。
  • 插入异常
    如果新建立一个系,因为没有学生,则无法把系主任输入到数据库中。
  • 删除异常
    如果一个系中的全部学生毕业了,则在删除学生信息的同时,该系和系主任的信息也删除了。
    因此可得出一个结论:Student模式并不是一个好模式。一个较好的模式应当不会发生更新异常、插入异常和删除异常,数据冗余应尽可能的少。
    所以如果只符合第一范式并不能满足需求,下面我们开始了解第二范式。

2、第二范式

3、第三范式

4、BCNF(扩展第三范式)

相关文章: