数据技术应用概论
第一章 绪论
数据素质培养意义
数据技术
数据科学应用体系框架
第二章 计算机信息系统
计算机信息系统的构成
计算机信息系统技术路线
第三章 抽样技术
抽样技术概述
网络调查和社会调查
抽样学习
抽样技术的基本概念
第四章 网络爬虫与文本数据生成
网络爬虫概述
网络爬虫技术操作
文本数据生成
第五章 数据库技术
数据库技术概述
数据库系统开发
关系数据库
数据仓库
第六章 SQL语言
SQL概述
SQL关系定义
SQL查询基本结构
数据库修改
视图
第七章 数据预处理技术
数据预处理概述
数据清理
数据集成
数据规约
数据变换
第八章 回归模型
回归模型的基础知识
最小二乘法
其他常用回归模型
第九章 Logistic建模技术
基础知识
梯度上升算法
第十章 关联规则挖掘
关联规则挖掘的基础知识
关联规则挖掘的 Apriori 算法
其它常用关联规则挖掘算法
第十一章 决策树分类规则
决策树分类规则的基础知识
决策树分类规则挖掘的ID3算法
几种常用的决策树
第十二章 K-平均聚类
基础知识
基于划分的K‐平均聚类算法
其他常用的聚类
第十三章 神经网络模型
神经网络模型的基础知识
误差逆传播算法
其他常用的神经网络算法
第十四章 支持向量机
支持向量机的基础知识
支持向量机的SMO算法
其他常用的支持向量机算法
第十五章 集成学习算法
集成学习算法的基础知识
随机森林算法
其他常用的集成学习算法
第十六章 数据可视化
数据可视化的基础知识
可视化设计基础
数据可视化工具
-
+
首页
抽样技术的基本概念
 ## 3.4.1 总体 - `总体`定义为由确定的统计调查任务规定,在时间、空间及若干其他标志上具有共同性质的客观存在的有限数量基本单元的全体;也定义为随机抽取的全部可能结果,即所有单元的标志值。 - `基本单元`称作总体基本单元、个体,是与总体相对应的概念。基本单元是总体中承担调查标志的个体。由基本单元组成的集合叫群单元。 - `抽样单元`是指实施抽样的单元。抽样单元并不总是基本单元,也可能是群单元。在抽样实践中,以基本单元为抽样单元的抽样称为个体抽样;以群单元为抽样单元的抽样则称为整群抽样。 - `抽样框`是全部抽样单元的完整列表,包括编号和对应的抽样单元名称。在抽样框中, 编号与抽样单元一一对应。同一编号在抽样框中只能出现一次,不能出现多次,同一编号不能对应两个不同的抽样单元。 - `目标总体`是作为调查目标的总体。被抽样总体也称作业总体,是抽样框所描述的总体。在理论上,被抽样总体与目标总体应该一致,从被抽样总体中抽取单元的数据分析结果适用于目标总体。但是在实际调查中,被抽样总体与目标总体不一致的情况经常出现。抽样框可能遗漏目标总体的若干单元,也可能包含并不属于目标总体的若干单元。 总体中基本单元数量用$$N$$表示,$$N$$个基本单元的标志值分别为$$y_1\,y_2\,,,y_n$$表示。常用的总体指标如下: - 总体总值,用Y表示:$$Y=\sum_{i=1}^{N}(y_i)$$ - 总体均值,用$$\overset{\-}Y$$表示:$$\overset{\-}Y=Y/N$$ - 总体方差,用$$S^2$$表示:$$S^2=1/(N-1)\sum_{i-1}^{N}(y_i-\overset{\-}Y)^2$$ - 总体方差的平方根为总体标准差,用S表示,其中$$S=\sqrt{S^2}$$ ## 3.4.2 样本 样本单元数量用$$n$$表示,$$n$$个样本单元的指标值分别用$$y_1,y_2,,,y_n$$表示。常用的统计量如下 - 样本总值,用$$y$$表示:$$y=\sum_{i=1}^{n}y_i$$ - 样本均值,用$$\overset\-y$$表示:$$\overset\-y=y/n=(\sum_{i=1}^{n}y_i)/n$$ - 样本方差,用$$s^2$$表示: ```latex s^2=1/(n-1)\sum_{i=1}^{n}(y_i-\overset\_y)^2 ```
张龙
2024年7月15日 13:36
转发文档
收藏文档
上一篇
下一篇
手机扫码
复制链接
手机扫一扫转发分享
复制链接
Markdown文件
分享
链接
类型
密码
更新密码