数据技术应用概论
第一章 绪论
数据素质培养意义
数据技术
数据科学应用体系框架
第二章 计算机信息系统
计算机信息系统的构成
计算机信息系统技术路线
第三章 抽样技术
抽样技术概述
网络调查和社会调查
抽样学习
抽样技术的基本概念
第四章 网络爬虫与文本数据生成
网络爬虫概述
网络爬虫技术操作
文本数据生成
第五章 数据库技术
数据库技术概述
数据库系统开发
关系数据库
数据仓库
第六章 SQL语言
SQL概述
SQL关系定义
SQL查询基本结构
数据库修改
视图
第七章 数据预处理技术
数据预处理概述
数据清理
数据集成
数据规约
数据变换
第八章 回归模型
回归模型的基础知识
最小二乘法
其他常用回归模型
第九章 Logistic建模技术
基础知识
梯度上升算法
第十章 关联规则挖掘
关联规则挖掘的基础知识
关联规则挖掘的 Apriori 算法
其它常用关联规则挖掘算法
第十一章 决策树分类规则
决策树分类规则的基础知识
决策树分类规则挖掘的ID3算法
几种常用的决策树
第十二章 K-平均聚类
基础知识
基于划分的K‐平均聚类算法
其他常用的聚类
第十三章 神经网络模型
神经网络模型的基础知识
误差逆传播算法
其他常用的神经网络算法
第十四章 支持向量机
支持向量机的基础知识
支持向量机的SMO算法
其他常用的支持向量机算法
第十五章 集成学习算法
集成学习算法的基础知识
随机森林算法
其他常用的集成学习算法
第十六章 数据可视化
数据可视化的基础知识
可视化设计基础
数据可视化工具
-
+
首页
数据库系统开发
## 5.2.1 数据库系统架构 - 随着基于数据库等技术的计算机信息系统蓬勃发展。信息系统应用复杂度和灵活度的提高,进一步将数据独立性和一致性技术保证问题提升到新高度。数据库系统的总体架构设计不断探索新的理论及其相应技术手段,逐步形成当前的数据库系统架构范式 **三级模式架构概念的背景意义三级模式架构概念的背景意义** - 1975年查尔斯ꞏ巴赫曼(Charles Bachman)指导的ANSI/X3/SPARC标准规划委员会提出数据独立性概念,及支撑该概念的三种模式架构。 `三种模式包括:外部模型、概念模型及内部(物理)模型。` - 虽然ANSI-SPARC从未成为正式标准,但其数据独立性概念及三层模式模型在信息系统构建中被广泛采用。目前的数据库系统架构也是基于ANSI-SPARC标准模式构建的。三种模式模型的提出力图提供一个新的数据独立性和一致性技术解决方案。其核心是强调保证数据的“逻辑独立性”。 - 数据库是根据数据模型组织数据的。简要说,根据用户业务要求确定存储哪些数据以及数据之间相互关联性。通过这些信息,将数据拟合到数据库模型中。其本质是按照一定规则将数量众多而又相互关联数据,装入一组既能较好地反映用户要求,又有良好操作性能的数据存储结构之中。 **三级模式架构** - 数据库三级模式模型架构。三级模式是基于计算机系统视角定义的。此概念架构的主要目标是对数据的含义和相互关系提供一致的定义,用于集成、共享和管理数据的完整性。  - 外模式(视图层,View level) 对应于用户操作,又称子模式或用户模式,描述用户所看到的数据库数据视图。 图是通过试图定义操作描述的数据之间“虚拟关系”,相关信息表示与某一应 用有关的数据逻辑。 视图模式是三层架构中最高层次的抽象。目的是实现用户通过独立自定义不同的视图,可以访问相同的数据。访问是独立的,不应影响其他视图的访问。 该架构的用户视图与数据的逻辑结构及其物理存储设备相互独立。即提供数据的逻辑独立性。 - 模式(逻辑层,Logical level) 又称概念模式或逻辑模式,描述数据库中存储什么数据及这些数据间存在什么关系。 是对数据库中全部数据的逻辑结构和特征的总体描述,是所有用户的公共(全局)数据视图。 逻辑层通过少量相对简单的结构描述整个数据库,屏蔽掉为实现该结构可能涉及到的复杂的物理层结构,使逻辑层的用户不必知道这样的复杂性。这称作数据的物理独立性。 - 内模式(物理层,Physical level) 内模式又称存储模式,对应于计算机硬件设备,描述数据在存储介质上的存储方式和物理结构,是数据库最低层次的抽象。 **三级模式间的关联** - 数据库系统的三级模式是数据的三个抽象级别,其把数据的具体组织留给数据库管理系统管理,使用户能逻辑地、抽象地处理数据,而不必关心数据在计算机中的具体表示方式和存储方式。 - 为了能够在系统内部实现这三个抽象层次的联系和转换,数据库管理系统在这三级模式之间提供了两层映像:外模式/模式映像和内模式/模式映像。两层映像保证了数据库系统中的数据能够具有较高的逻辑独立性和物理独立性 ## 5.2.2 数据库系统设计 数据库系统设计是基于三级模式标准的技术实施工作,根据数据模型组织数据。设计人员基于用户业务要求确定存储哪些数据以及数据之间相互关联性。基于这些信息,将数据拟合到数据库模型中。数据库设计其本质是将数量众多而又相互关联数据,按照一定规则构造出一组既能较好地反映用户要求,又有良好操作性能的数据存储结构。 通常包括如下5个步骤。 ```mindmap ### 需求分析 ### 概念设计 ### 逻辑设计 ### 物理设计 ### 运行和维护 ``` >- 1、需求分析 实际应用中,数据库并不独立使用,是作为信息系统的组成部分发挥重要作用的。数据库的需求分析是落实信息系统要求的具体操作。 构建信息系统的目的是完成用户某些业务功能。 需求分析首要任务就是确定系统需要实现的功能,即确定系统边界。这是系统需要处理和保存数据的基础。 重要工作包括: `• 调查和分析用户的业务活动和数据的使用情况` `• 弄清相关数据的种类、范围、数量以及它们在业务活动中交流的情况,` `• 确定用户对数据库系统的使用要求和各种约束条件等,形成用户需求规约。` >- 2、概念设计 基于用户需求建立抽象的概念模型, 概念设计要求能真实充分反映用户需求,易于理解,易于更改,易于向各种数据模型转换。 概念模型是独立于DBMS的,用来表述数据与数据之间的联系,其直接面向用户需求,容易被用户理解,方便数据库设计者与用户的交流。通过不断迭代设计与用户具体应用相关的数据结构,最终得到一个正确、完整地反应用户数据及联系并满足各种处理要求的概念模型。之后把概念模型转换成具体机器上DBMS支持的数据模型。 概念模型可以采用符号、图形等各种表达形式。实体关系模型(En tit y Relationship,ER模型)就是其中一种。 >- 3、逻辑设计 逻辑设计阶段的主要任务是将概念模型转化为DBMS支持的数据模型。即适应于某种特定数据库管理系统所支持的逻辑数据模型。 逻辑设计阶段还需为各种数据处理应用创建相应的逻辑子模式(外模式)。 逻辑设计必须遵从规范化规则指导。规范化目标是确保数据结构适合通用查询,规避异常插入、更新和删除等不良操作,以减少数据冗余,提高数据完整性。 规范化概念是1970年科德在关系模型中首次引入的。通过提出范式(normal form NF)标准,用于指导评价逻辑设计规范化水平。所谓第1范式(1NF)是指为确保数据库列(属性)和表(关系)的组织操作是在数据库完整性限制下执行,而提出的认定完整性的第一个标准。此后随着数据库应用场景复杂化,又以第2-6范式以及博伊斯-科德范式(Boyce–Codd normal form BCNF)等给出不同水平完整性规范化标准,用于指导逻辑设计。 >- 4、物理设计 数据库管理系统(DBMS)提供的存储结构和存取方法等依赖于计算机的各项硬件物理设备。物理设计即选定合适的物理存储结构、存取方法和存取路径等。其设计结果就是所谓“物理数据库”。 >- 5、运行与维护设计 数据库系统投入运行后,可能需要的调整与修改预判。
张龙
2024年8月12日 17:28
转发文档
收藏文档
上一篇
下一篇
手机扫码
复制链接
手机扫一扫转发分享
复制链接
Markdown文件
分享
链接
类型
密码
更新密码