初识数据库 数据库技术的诞生与发展
数据库技术的诞生
1. 数据与信息
2. 数据处理与数据管理
数据库技术的发展
1. 人工管理阶段数据库技术的诞生
数据库(Database,DB) 是存储在计算机内、有组织、可共享的数据和数据对象(如表、视图、存储过程和触发器等)的集合。这种集合按一定的数据模型(或结构)组织、描述并长期存储,同时能够以安全可靠的方法进行数据的检索和存储。
简单地说,数据库就是电子化的文件柜——存储电子文件的处所。如通讯录是一个小型的数据库,图书馆则是相对较大的数据库了。小数据库尚可手工管理,而大型数据库就得由计算机进行管理了。
数据库有以下两个特点
(1) 集成性。 将某特定应用环境中的各种应用相关的数据及数据间的联系全部集中并按照一定的结构形式进行存储。或者说,可以把数据库看成是若干个性质不同的数据文件的联合和统一的数据整体。
(2) 共享性。 数据库中的数据可为多个不同的用户所共享,即不同的用户可以使用多种不同的语言,为了不同的应用目的而同时存取数据库,甚至可以同时存取数据库中的同一数据。
1. 数据与信息
(1) 信息
信息 是人类主观对客观现实事物存在方式、状态以及事物间联系的抽象。信息是客观存在的,人类有意识地对信息进行采集加工、传递,从而形成了各种消息、情报、指令、数据及信号等。例如,对于某学生的基本情况来说,其学号是S1,姓名是luffy,性别是男,年龄是17岁,所在系别是航海系等, 这些都是关于该同学的具体信息,是该学生当前存在状态的反映。
信息是可存储的,人类使用大脑存储信息。而计算机存储器、录音、录像等技术的发展,进一步扩大信息存储的范围。人们还可以借助计算机对收集到的信息进行整理。
(2) 数据
数据 是记录信息的可识别的符号组合,是信息的具体表现形式。如上面提到学生的信息可用一组数据“S1、luffy、男、17、航海系”表示。这组数据能被人们理解是因为这些符号已经被赋予了特定的语义,对于数据(luffy,航海系),如果不了解其语义,就有可能解释为“luffy的果实能力是航海系的”。具有特定的语义,数据才能够传递信息。也就是说,数据和它的语义是不可分割的。
由上可知,信息和数据之间存在着固有的联系:数据是信息的符号表示或载体,信息是数据的意义,是对数据的解释。数据被赋予了特定的语义,才具有了传递信息的功能。
2. 数据处理与数据管理
数据处理是将数据转换为信息的过程,包括数据的收集、管理、加工利用乃至信息输出的演变计算等一系列活动。
在数据处理过程中,通常计算对计算机来讲是比较简单的,但是数据管理就比较复杂了。 数据管理包括数据的收集、分类、组织、编码、存储、维护、检索和传输等许多操作,这些操作是数据处理业务的基本环节。可以说,数据处理的核心问题就是数据管理。
一个通用、高效而又方便的管理方法将会大大提高数据处理的效率。至此,数据库技术就诞生了。数据库技术正是为了有效管理数据,提高数据处理的效率而发展并完善起来的专门技术。
数据库技术的发展
数据处理的核心问题是数据管理,随着计算机硬件软件的发展,数据库技术经历了人工管理、文件系统和数据库系统三个发展阶段。
1.人工管理阶段
在20世纪50年代中期以前,计算机主要用于科学计算。当时的硬件外存只有纸带,卡片,磁带,没有磁盘等直接存取的存储设备;而软件方面,没有操作系统,没有专门管理数据的软件;数据的处理方式是批处理。
人工管理阶段特点:
①数据不保存(当时计算机主要用于科学计算,一般不需要将数据进行长期保存)
②应用程序管理数据(数据需要由应用程序自己设计,说明和管理,没有相应的软件系统负责数据的管理工作。应用程序中不仅要规定数据的逻辑结构,而且要设计物理结构,包括存储结构,存取方法,输入方式等)
③数据不共享(数据是面向应用程序的,一组数据只能对应一个程序。当多个应用程序涉及某些相同的数据时必须各自定义,无法相互利用,参照,因此程序与程序之间有大量的冗余数据)
④数据不具有独立性(数据的逻辑结构或者物理结构发生变化后,必须对应用程序作相应的修改,数据完全依赖于应用程序,数据缺乏独立性)
应用程序与数据之间一一对应关系:
2.文件系统阶段
20世纪50年代后期到60年代中期,此时硬件方面有了发展,有了磁盘,磁鼓等直接存取存储设备。在软件方面,操作系统中已经有了专门的 数据管理软件 ,一般称为文件系统。不仅有了批处理,还有了联机实时处理。
磁鼓是利用铝鼓筒表面涂覆的磁性材料来存储数据的。鼓筒旋转速度很高,因此存取速度快
文件管理系统管理数据特点:
①数据可以长期保存(计算机大量用于数据处理,数据需要长期保存在外存上反复进行查询,修改,插入和删除等操作)
②由文件系统管理数据=(由专门的软件即文件系统进行数据管理,文件系统把数据组织成相互独立的数据文件,利用“按文件名访问,按记录进行存取”的管理技术,提供了对文件进行打开与关闭,对记录读取和写入等存取方式)
然而文件系统仍存在以下缺点:
①数据共享性差,冗余度大(在文件系统中,一个(或一组)文件基本上对应一个应用程序,即文件仍然是面向应用的。当不同的应用程序具有部分相同的数据时,也必须建立各自的文件,而不能共享相同的数据,因此数据冗余度大,浪费存储空间。同时,由于相同的数据重复存储,各自管理,容易造成数据的不一致性,给数据的修改和维护带来困难)
②数据独立性差(文件系统中的文件是为某一特定的应用服务的,文件的逻辑结构是针对具体的应用来设计和优化的,因此对文件中的数据再增加一些新的应用会很困难)
文件系统阶段的一一对应关系:
3.数据库系统阶段
20世纪60年代后期以来,计算机管理的对象规模越来越大,应用范围越来越广泛,数据量急剧增加,同时多种应用,多种语言互相覆盖的共享集合的要求越来越强烈。
在这种背景下,以文件系统作为数据管理手段已经不能满足应用的需求,为了解决多用户,多应用共享数据的要求,出现了统一管理数据的专门软件系统,数据库管理系统。
数据库系统的特点:
①数据结构化(数据库系统实现整体数据的结构化,在文件系统中,文件中的记录内部具有结构,但是记录的结构和记录之间的联系被固化在程序中。数据“整体”结构化是指数据库中的数据不再针对某一个应用,而是面向整个组织或企业)
②数据的共享性高,冗余度低且易扩充(由于数据是面向整个系统,是有结构的数据,不仅可以被多个应用共享使用,而且容易增加新的应用,这使得数据库系统弹性大,易于扩充)
③数据独立性高(包括物理独立性(是指用户的应用程序与数据库中数据的物理存储是相互独立的)和逻辑独立性(是指用户的应用程序与数据库的逻辑结构是相互独立的))
④数据由数据库管理系统统一管理和控制
数据库系统阶段:
数据库是长期存储在计算机内有组织,大量,共享的数据集合。它可以供各种用户共享,具有最小冗余度和较高的数据独立性。数据库管理系统在数据库建立,运用和维护时对数据库进行统一的控制,以保证数据的安全性和完整性,并且在多用户同时使用数据库时进行并发控制,在发生故障后对数据库进行恢复。