数据库随笔-1NF,2NF,3NF详解
- 基础概念
- 通过表的更新来举例说明
- 总结
基础概念
1. 第一范式(1NF):每一列都是不可分割的原子数据项
2. 第二范式(2NF):在1NF的基础上,非码属性必须完全依赖于码(在1NF基础上消除非主属性对主码的部分函数依赖)* 几个概念:1. 函数依赖:A-->B,如果通过A属性(属性组)的值,可以确定唯一B属性的值。则称B依赖于A例如:学号-->姓名。 (学号,课程名称) --> 分数2. 完全函数依赖:A-->B, 如果A是一个属性组,则B属性值得确定需要依赖于A属性组中所有的属性值。例如:(学号,课程名称) --> 分数3. 部分函数依赖:A-->B, 如果A是一个属性组,则B属性值得确定只需要依赖于A属性组中某一些值即可。例如:(学号,课程名称) -- > 姓名4. 传递函数依赖:A-->B, B -- >C . 如果通过A属性(属性组)的值,可以确定唯一B属性的值,在通过B属性(属性组)的值可以确定唯一C属性的值,则称 C 传递函数依赖于A例如:学号-->系名,系名-->系主任5. 码:如果在一张表中,一个属性或属性组,被其他所有属性所完全依赖,则称这个属性(属性组)为该表的码例如:该表中码为:(学号,课程名称)* 主属性:码属性组中的所有属性* 非主属性:除过码属性组的属性3. 第三范式(3NF):在2NF基础上,任何非主属性不依赖于其它非主属性(在2NF基础上消除传递依赖)
通过表的更新来举例说明
初始表存在的问题:
1.存在非常严重的数据冗余:姓名,系名,系主任;
2.数据添加存在问题:添加新开设的系和系主任时,数据不合法;
3.数据删除存在问题:张无忌同学毕业了,删除数据会将系的数据一起删除。
在此表中,码为(学号,课程名称)。而第二范式的概念为:在1NF的基础上,非码属性必须完全依赖于码。而在此表中姓名,系名,系主任都是部分依赖于码,所以得消除。
学生表依旧存在的问题:只想要添加系名与系主任时,必须添加学生学号与姓名。假设当学校开设新系时,这样的设计不合理。
总结
- 根据上述过程,根据1NF,2NF,3NF相应规则将一个初始表分为了各子表。在设计数据库表时,根据各表之间的一对一,一对多,多对多关系,设计相应的外键约束,从而可以设计出一个比较合理的数据库表。