数据技术应用概论
第一章 绪论
数据素质培养意义
数据技术
数据科学应用体系框架
第二章 计算机信息系统
计算机信息系统的构成
计算机信息系统技术路线
第三章 抽样技术
抽样技术概述
网络调查和社会调查
抽样学习
抽样技术的基本概念
第四章 网络爬虫与文本数据生成
网络爬虫概述
网络爬虫技术操作
文本数据生成
第五章 数据库技术
数据库技术概述
数据库系统开发
关系数据库
数据仓库
第六章 SQL语言
SQL概述
SQL关系定义
SQL查询基本结构
数据库修改
视图
第七章 数据预处理技术
数据预处理概述
数据清理
数据集成
数据规约
数据变换
第八章 回归模型
回归模型的基础知识
最小二乘法
其他常用回归模型
第九章 Logistic建模技术
基础知识
梯度上升算法
第十章 关联规则挖掘
关联规则挖掘的基础知识
关联规则挖掘的 Apriori 算法
其它常用关联规则挖掘算法
第十一章 决策树分类规则
决策树分类规则的基础知识
决策树分类规则挖掘的ID3算法
几种常用的决策树
第十二章 K-平均聚类
基础知识
基于划分的K‐平均聚类算法
其他常用的聚类
第十三章 神经网络模型
神经网络模型的基础知识
误差逆传播算法
其他常用的神经网络算法
第十四章 支持向量机
支持向量机的基础知识
支持向量机的SMO算法
其他常用的支持向量机算法
第十五章 集成学习算法
集成学习算法的基础知识
随机森林算法
其他常用的集成学习算法
第十六章 数据可视化
数据可视化的基础知识
可视化设计基础
数据可视化工具
-
+
首页
数据可视化的基础知识
## 16.1.1 数据可视化历史简要回顾 ```timeline # 人类早期 以洞穴和峭壁岩画、印文陶器,以及**泥版和甲骨形象文字,青铜器图形铭文**等形式开创了通过制作图画图形传达情感与思想的文化传统。 # 中国商周时期 《周易》中的阴阳太极图是数据图视化的先驱。在太极图表示的**阴阳二元论**的基础上,《周易》建立了国家一系列事物运行描述与规律的论证方法 # 公元前约500年 古希腊大哲学家泰勒斯根据古埃及尼罗河泛滥后耕地重新丈量划分创立的几何学,开创了抽象理性思维逻辑的传统。 # 公元前约200年 古希腊基于天象观察,建立以图形表示地球和日月星辰的“**同心圆**”与“**本轮—均轮**”宇宙模型,开创了科学可视化先河。 # 公元2世纪 托勒密制作出第一个世界地图。 中国辽代统和年间(983~1012年)出现以**娟为底,红黄蓝三色**彩刷的《南无释迦尼佛》画卷。 欧洲中世纪出现描绘**多个天体运行轨迹时序变化**的图表等。  # 16—18世纪 欧洲历经文艺复兴进入**近代科学时期**。伴随建筑工程和绘画艺术创作,出现将三维现实世界绘制为二维画图的透视法。此外,新航路开辟的同时也伴随着地理测绘技术的快速。 下图描述了**Hasan火山喷发**时的情况,图中中央为两座相连的山峰,右侧的山峰喷发出黑烟,图片下方的方块代表人们居住的房屋。  ==== # 1570年 出版的Theatrum Orbis Terrarum 被视为第一部具有现代意义的地图集。  # 17世纪 笛卡儿将代数与几何相结合创立了坐标系与解析几何。  # 18世纪 社会与科学快速发展:牛顿发现了天体运动规律、建立了微积分; 数学和物理成为科学探索的基础; 统计学出现萌芽; 冒险家继续在世界各地探索着未知的事物; 出现了三色彩印和平板印刷;英国开始了工业革命;社会管理逐渐走向数量化。 #19世纪 欧洲出现社会经济统计热潮,各国政府开始收集和发布人口、商业及社会情况统计数据与图表。下图两幅图分别绘制了丹麦和挪威1700~1780 年进出口情况,以及苏格兰1780年-1781年进出口贸易条形图。  # 19世纪中期 社会各业都认识到了数据的作用,统计学的影响迅速扩大,涌现出了众多图形创新。 **(1)Minard的创新** Minard绘制了1812-1813年对俄战争中法国人力持续损失示意图。Minard认为基于位置的量化信息更适合表现在地图上,之后他又绘制了美国内战对欧洲棉花贸易的影响和法国的酒类出口情况的流地图。Minard的另一个创新是把饼状图添加到地图上。  图中包含了如下信息:部队的规模、地理坐标、军队的分支和汇合情况、前进和撤退方向、抵达某处的时间以及撤退路上的温度等。浅色代表进军路线,深色代表撤退路线,最下方的折线图代表撤退时温度的变化,最初渡Berezina河时法军有 422000人,他们向东进入俄国领土,在莫斯科的时候还有10万 人左右。从右到左,他们朝西撤军,渡过 Niemen河的时候,仅仅剩下 1万人。 **(2) Galton的创新** - Galton在可视化领域的创新是天气图,从图中可以看出气压、风向、降水和温度的情况。如图所示,每一天都是一个3×3的格子:第1行表示气压、第2 行表示风和降水、第3行表示温度;第1列代表早晨、第2列代表下午、第3列代表晚上。 - Galton的可视化创新展示了一种经验科学的研究方法,首先利用可视化总结抽象数据,发现模式,其次提出洞见,最后形成理论。  **(3) 统计地图集** 到19世纪中叶,官方组织开始收集和发布关于人口、商业和社会情况的统计数据与图表。1872~1874年由Francis A.Walker指导的Statistical Atlas of the UnitedStates,Based on the Results of the Ninth Census,展示的是美国第九次全国人口普查的情况,如左图马赛克图表示的是密苏里州的人口构成,右图的双边直方图表示人口死亡原因的细节。  # 20世纪的前50年 是数据可视化的低潮,创新虽进展缓慢,但仍在继续。这个时期,推广数据可视化的代表人物是Arthur L. Bowley,其著作Elements of Statistics 被认为是英国第一本现代统计学教材,书中介绍了描述性统计方法在经济学和社会科学中的应用。主题图方面的创新是Beck关于地铁图的设计,该图的特点是:用颜色区分路线,路线以水平、垂直、45°角的形式来表现,路线上的车站距离与实际距离不是完全成比例的。  在这个时期,数据可视化最重要的影响在**天文、物理等科学领域**中,主要包括以下两种:一是蝴蝶图,用于研究太阳黑子随时间的变化情况。二是Hertzsprung·Russell ,用以解释恒星的演化情况,是现代天体物理的奠基之一。  # 1972年 Andrews提出调和曲线图,调和曲线图是将多元数据以二维曲线展现的一种统计图,常用于表示多元数据的结构。图为应用分类实验数据集iris(鸢尾花卉数据集)绘制的调和曲线图,图中的三种颜色指的是鸢尾花的品种。  # 20世纪中期至今 计算机技术进步推动数据可视化发展进入黄金时代,涌现出的新的视觉表达方式,形成科学可视化、信息可视化和可视分析学三类理论方法。  ```` - **数据可视化历史简要回顾**:数据可视化是通过图形化手段展示数据的过程,其历史可以追溯到几千年前。 - **早期地图和图表**:古代文明就开始使用地图和简单的图表来展示地理和天文学数据,例如巴比伦和埃及的星图和地图。 - **统计图表的起源**:18世纪和19世纪,随着统计学的发展,现代数据可视化技术逐渐成形。威廉·普莱费尔(William Playfair)是现代图表之父,发明了折线图、柱状图和饼图。 - **20世纪的数据可视化**:计算机的发明和发展,使得数据可视化工具和技术不断进步,数据可视化开始应用于各个领域,如商业、科学研究和工程。 ## 16.1.2 科学可视化 - **科学可视化**:科学可视化专注于将科学数据和现象转化为可视图形,有助于研究人员理解复杂的科学概念和数据。 - **三维可视化**:科学数据通常是多维的,三维可视化技术能帮助研究人员观察和分析三维空间中的数据,例如分子结构、气象数据和医学成像。 - **仿真和模拟**:科学可视化常用于仿真和模拟实验结果,帮助预测和验证科学理论。常见的应用包括气候模拟、宇宙模拟和流体动力学仿真。 - **交互式可视化**:交互式科学可视化工具允许用户动态调整视角、缩放和参数,探索数据的不同方面,提升数据分析的效率和准确性。 ## 16.1.3 数据可视化 - **数据可视化**:数据可视化是指将数据转化为图形或图表,以便更容易理解和分析。它在商业、工程、医疗和科学研究中广泛应用。 - **静态可视化**:静态图表是常见的数据可视化形式,包括折线图、柱状图、饼图、散点图等。静态图表适用于简单、固定的数据展示。 - **动态图表**:动态图表能够展示时间序列数据的变化,帮助观察趋势和模式。常见的动态图表包括动画折线图、动态图例和时间序列图。 - **交互式可视化**:交互式可视化工具允许用户与数据进行交互,通过点击、拖拽和缩放等操作,探索数据的不同方面。常见工具包括Tableau、Power BI和Dash。 ### 示例代码 - 使用本平台在线工具进行学习。 - 地址:首页->工作台[【快捷链接】](https://zenodt.com/workbench "【快捷链接】"),点击 _1717661367.png) 按钮,登录即可。 ```python #绘制折线图 import matplotlib.pyplot as plt # 示例数据 x = [1, 2, 3, 4, 5] y = [2, 3, 5, 7, 11] plt.figure(figsize=(10, 5)) plt.plot(x, y, marker='o') plt.title('Line Plot Example') plt.xlabel('X-axis') plt.ylabel('Y-axis') plt.grid(True) plt.savefig('line_plot.png') plt.show() ``` ```python #绘制散点图 import matplotlib.pyplot as plt # 示例数据 x = [1, 2, 3, 4, 5] y = [2, 3, 5, 7, 11] plt.figure(figsize=(10, 5)) plt.scatter(x, y, color='red') plt.title('Scatter Plot Example') plt.xlabel('X-axis') plt.ylabel('Y-axis') plt.grid(True) plt.savefig('scatter_plot.png') plt.show() ``` ```python # 导入饼图的包 from pyecharts.charts import Pie pie = Pie(init_opts=opts.InitOpts(theme=ThemeType.DARK)) # radius:设置饼图的形状,变成环形图 pie.add('',[list(z) for z in zip(Faker.choose(),Faker.values())],radius=['50%','80%']) pie.set_global_opts(title_opts=opts.TitleOpts(title='饼图的绘制')) # 设置颜色 pie.set_colors(['#FFDEAD','Honeydew','LavenderBlush','AntiqueWhite','#87CEFA','Gainsboro','FloralWhite']) # 数据的显示:{a}:系列名。 {b}:数据名。{c}:数据值。 pie.set_series_opts(label_opts=opts.LabelOpts(formatter='{b}:{d}%')) # 展示图表 # pie.render_notebook() # 将图表渲染到html文件中 pie.render('pie_chart.html') ``` ## 16.1.4 可视分析学 - **可视分析学**:可视分析学(Visual Analytics)是数据可视化和数据分析相结合的学科,旨在通过可视化手段增强人类的分析能力,帮助人们从大量复杂数据中发现有价值的信息和洞见。 - **特点**: - **交互性**:通过交互式可视化界面,用户可以动态探索和分析数据,实时获取反馈和结果。 - **多视图协同**:结合多种可视化视图和分析方法,从不同角度展示数据,提供全方位的分析支持。 - **数据融合**:整合来自多个数据源的异构数据,提供统一的分析和展示平台。 - **智能分析**:结合机器学习和人工智能技术,提供自动化的数据分析和模式识别功能,辅助用户决策。 - **应用领域**: - **商业智能**:通过可视化仪表板和报告,支持企业管理决策和业务优化。 - **公共安全**:通过可视化手段监控和分析安全事件,提升应急响应能力。 - **健康医疗**:通过可视化分析病人数据和医疗记录,支持临床决策和健康管理。 - **科学研究**:通过可视化分析实验数据和模拟结果,支持科学发现和技术创新。 数据可视化的基础知识涵盖了从历史发展、科学可视化、数据可视化到可视分析学的方方面面,理解这些内容能够帮助我们更好地应用数据可视化技术,提升数据分析和决策的效果。
张龙
2024年8月13日 15:02
转发文档
收藏文档
上一篇
下一篇
手机扫码
复制链接
手机扫一扫转发分享
复制链接
Markdown文件
分享
链接
类型
密码
更新密码