数据技术应用概论
第一章 绪论
数据素质培养意义
数据技术
数据科学应用体系框架
第二章 计算机信息系统
计算机信息系统的构成
计算机信息系统技术路线
第三章 抽样技术
抽样技术概述
网络调查和社会调查
抽样学习
抽样技术的基本概念
第四章 网络爬虫与文本数据生成
网络爬虫概述
网络爬虫技术操作
文本数据生成
第五章 数据库技术
数据库技术概述
数据库系统开发
关系数据库
数据仓库
第六章 SQL语言
SQL概述
SQL关系定义
SQL查询基本结构
数据库修改
视图
第七章 数据预处理技术
数据预处理概述
数据清理
数据集成
数据规约
数据变换
第八章 回归模型
回归模型的基础知识
最小二乘法
其他常用回归模型
第九章 Logistic建模技术
基础知识
梯度上升算法
第十章 关联规则挖掘
关联规则挖掘的基础知识
关联规则挖掘的 Apriori 算法
其它常用关联规则挖掘算法
第十一章 决策树分类规则
决策树分类规则的基础知识
决策树分类规则挖掘的ID3算法
几种常用的决策树
第十二章 K-平均聚类
基础知识
基于划分的K‐平均聚类算法
其他常用的聚类
第十三章 神经网络模型
神经网络模型的基础知识
误差逆传播算法
其他常用的神经网络算法
第十四章 支持向量机
支持向量机的基础知识
支持向量机的SMO算法
其他常用的支持向量机算法
第十五章 集成学习算法
集成学习算法的基础知识
随机森林算法
其他常用的集成学习算法
第十六章 数据可视化
数据可视化的基础知识
可视化设计基础
数据可视化工具
-
+
首页
计算机信息系统技术路线
## 2.2.1 分布式技术路线 信息系统根据硬件、软件、数据等信息资源在空间的分布情况,系统的结构可分为`集中式`和`分布式`两大类型 **集中式系统:信息资源在空间上集中配置的系统称为集中式系统。** - `集中式系统的主要优点`: >1、信息资源集中,管理方便,规范统一; 2、专业人员集中使用,有利于发挥他们的作用,便于组织人员培训和提高工作; 3、信息资源利用率高; 4、系统安全措施实施方便。 - `集中式系统的主要缺点`: >1、随着系统规模的扩大和功能的提高,复杂性迅速增长,给管理、维护带来困难; 2、对组织变革和技术发展的适应性差,应变能力弱; 3、不利于发挥用户在系统开发、维护、管理方面的积极性与主动精神; 4、系统比较脆弱。主机出现故障时可能使整个系统停止工作。  **分布式系统:利用计算机网络把分布在不同地点的计算机硬件、软件、数据等信息资源联系在一起服务于一个共同的目标而实现相互通信和资源共享,就形成了信息系统的分布式结构。具有分布结构的系统称为分布式系统。** - `分布式系统具有以下优点`: >1、可以根据应用需要和存取方便来配置信息资源; 2、利于发挥用户在系统开发、维护和信息资源管理方面的积极性和主动性,提高系统对用户需求变更的适应性和对环境的应变能力; 3、系统扩展方便。增加一个网络结点一般不会影响其他结点的工作。系统建设可以采取逐步扩展网络结点的渐进方式,以合理使用系统开发所需资源; 4、系统的健壮性好(网络上一个结点出现故障一般不会导致全系统瘫痪)。 - `分布式系统具有以下缺点`: >1、由于信息资源分散,系统开发、维护和管理的标准、规范不易统一; 2、配置在不同地点的信息资源一般分属管理信息系统的各子系统。管理协调有一定难度; 3、各地的计算机系统工作条件与环境不一,不利于安全保密措施的统一实施。 ## 2.2.2 客户端-服务器架构 C/S架构(client-server architecture客户机/服务器模式)分为客户机和服务器两层: >第一层是在客户机系统上结合了表示与业务逻辑,即`用户表示层。` 第二层是通过网络结合了数据库服务器。`即数据库层。` - 客户端和服务器直接相连,第一层的客户机并不是只有输入输出,运算等能力,它可以处理一些计算,数据存储等方面的业务逻辑事务;第二层的服务器主要承担事务逻辑的处理,本来事务很重,但是由于客户机可以分担一些逻辑事务,所以减轻了服务器的负担。  ## 2.2.3 浏览器-服务器架构 - B/S模式(browser-server architecture),即浏 览器/服务器结构。它是C/S架构的一种改进,可以认为是三层C/S架构。主要是利用了不断成熟的WWW浏览器技术,用通用浏览器实现原来需要复杂专用软件才能实现的强大功能,并节约了开发成本,是一种全新的软件系统构造技术。  >- `第一层是浏览器,即客户端,只有简单的输入输出功能,处理极少部分的事务逻辑。由于客户不需要安装客户端,只要有浏览器就能上网浏览。` >- `第二层是WEB服务器,用户访问数据库时,首先向WEB服务器发送请求,WEB服务器统一请求后会向数据库服务器发送访问数据库的请求,这个请求是以SQL语句实现的。` >- `第三层是数据库服务器,存放大量的数据。数据库服务器收到了WEB服务器的请求后,会对SQL语句进行处理,并将返回的结果发送给WEB服务器,接下来,WEB服务器将收到的数据结果转换为HTML文本形式发给浏览器。` | 角度 | C/S | B/S | | --- | --- | --- | | 硬件环境 | 专用网络 | 广域网 | | 安全要求 | 面向相对固定的用户群信息安全的控制能力很强 | 面向时不可知的用户群对安全的控制能力相对弱 | | 程序架构 | 更加注重流程系统运行速度可较少考虑 | 对安全以及访问速度要多重的考虑B/S结构的程序架构是发展的趋势 | | 软件重用 | 差 | 好 | | 系统维护 | 升级难 | 开销小、方便升级 | | 处理问题 | 集中 | 分散 | | 用户接口 | 与操作系统关系密切 | 跨平台,与浏览器相关 | | 信息流 | 交互性低 | 交互密集 | ## 2.2.4 分布式软件系统平台 - 2002年美国Apache基金会提出开源分布式软件系统研发的资助项目。在其推动下,2004年 Google Research发表了一篇关于`MapReduce算法`的论文,Google公司在操作系统设计与实现会议上`以MapReduce为主题,提出分布式计算理论框架`。其中MapReduce一词是Mapping映射(函数)与Reduction归约(迭代计算)两个词合成的。就此成为该理论框架中`表示处理复杂数据分布式计算的专有概念`。卡廷(Cutting)和卡法雷拉(Cafarella)投入研发MapReduce的技术实现,并进一步开展与支持搜索引擎算法的分布式文件系统(nutch distributed file system,NDFS)集成的研究。`2006年`卡廷研发出的软件在Yahoo互联网系统成功运行,并被命名为Hadoop,又称为`Apache Hadoop`
张龙
2024年8月14日 16:01
转发文档
收藏文档
上一篇
下一篇
手机扫码
复制链接
手机扫一扫转发分享
复制链接
Markdown文件
分享
链接
类型
密码
更新密码