涉及考点:数据库模式,ER模型,关系代数与元祖演算,规范化理论,并发控制,分布式数据库系统,数据仓库和数据挖掘
数据库模式
三级模式-二级映射
常考选择题
三级模式,两种映射的这种涉及属于层次架构体的设计,这种设计为我们在应用数据库的时候提供了很多便利,同时提高了整个体系的可维护性和可扩展性
当数据库的内部结构发生改变的时候,我们只需要去修改它的映射关系,而不需要去主动用用户的代码
数据库的设计过程
ER模型
关系代数与元祖模型
关系代数
主要出现在综合题知识里面,以选择题的形式出现
1,给我们一个关系代数表达式,然后找出与之等价的关系代数表达式
2,给一个业务场景,然后要完成给什么样的职能,让写出他的关系代数表达式
并,交,差,笛卡尔积,投影,联结
规范化理论(比较重要)
函数依赖
规范化理论的价值和用途
键(如何求)
范式
范式的等级越高,那么他的数据的密度就越小,那也就是说他的拆分的表越多,这样子就可以带来性能的问题,所以一般采用折中方式,只采用第三范式即可
- 第一范式(1NF):在关系模式R中,当且仅当所有域只包含原子值,即每一个分量都是不可再生的数据项,则称作R是第一范式
- 第二范式(2NF):当且仅当R是1NF,且每一个非主属性完全依赖主键(不存在部份依赖)则成为R是第二范式
- 第三范式(3NF):当且仅当R是1NF,且E中没有非主属性传递依赖于码时,则称R是第三范式
思考题
请思考该关系模式会存在什么问题(从数据冗杂,更新异常,插入异常,删除异常这几个方面来考虑)解决方案是什么?
BC范式(BCNF):设R是一个关系模型,F是他的依赖集,R属于BCNF当且仅当其F中每一个依赖的决定性因素必定包含R的某个候选码
模式分解
当前讲范式的时候,我们已经提到,当范式的级别不够的时候,我们会将模式进行拆分,拆分之后,他的级别就上去啦,然后再拆分的时候,当我们需要考虑到不同的因素,有他的机制和原则,需要注意,模式分解我们要讲两个方面的要求
表格法
公式法
并发控制
事务:
把很多的操作封装,把他看作一个整体,来进行操作,很多操作呐,如果他不依同时执行完的话,那可能出现问题,所以就需要事务来进行合并,这些操作同时完成,同时失效.
分布式数据系统
数据库完整性约束
简单情况:
实体完整性约束(定义主键),参照完整性约束(外键,可为空),用户自定义完整性约束
复杂情况:
触发器(通过脚本)
数据库安全
目前,仅仅从数据库的角度去看待安全问题,具体的安全问题
数据库备份与恢复
分类方式一
分类方式2:(以量区分)
故障与恢复
数据仓库和数据挖掘
数据库
数据库是根据业务的需求,看哪项数据需要记录的一个存储系统,但是当数据存储到一定容量的时候,那数据库的效率就会下降,而这时候需要如何解决呢,最简单的办法就是删掉一部分没有用的历史数据,但是这是在某种层面上是浪费数据的,所以我们需要找个地方把他存起来
数据仓库
面向主题的而不是应用,不轻易修改
数据挖掘方法分类
反规范化
由于规范化会不断的拆分,从而导致数据表过多,这样虽然减少了数据冗余,提高了增删改的速度,但是会增加查询的工作量,系统需要进行多次连接,才能进行查询操作,使得系统效率大大下降.
大数据
大数据实际上是指海量数据进行处理的一项技术,这些数据具备的特点是数量极大,要求处理的速度极快,又有一定的多样性,而且这些数据又要有价值,比较多的是进行联合分析.
版权归原作者 林寻星辰 所有, 如有侵权,请联系我们删除。