数据技术应用概论


  • 简介
  • 目录大纲
  • 最新文档

    关联规则挖掘的 Apriori 算法

    1.Apriori算法解读 关联规则挖掘算法大体分为两步: 首先找出所有频繁项集; 其次由频繁项集产生强关联规则。以表 10.1 的数据为例, 事先假定最小支持度 $$min_s$$=40%, 最小置信度$$mixn_c$$=70%。具体步骤如下: 找出所有频繁项集 Apriori采用逐层搜索迭代的方法。即在表10.1中找出每单一商品被购买的数量, 记为候选 1-项集$$c_1$$, 具体见表1……

    张龙 - 2024年8月15日 09:53


    基础知识

    9.1.1 问题提出 离散型数据在实际应用中经常遇到。 例如,商品好坏、保险索赔次数、社会经济运行稳定与否等等都用离散型数据描述。 Logistic建模技术是分析离散型数据的常用方法之一。 二分类数据是常见的离散型数据之一。 例如,下表给出了流动人口居留意愿的调查数据。 这里,居留意愿的取值为0或1。 1代表有长期居留意愿,0代表没有长期居留意愿。那么,居留意愿的观测数据就是二分类数据。……

    张龙 - 2024年8月15日 09:40


    回归模型的基础知识

    1问题提出 回归模型能够描述响应变量(或称因变量)和一个解释变量(或称自变量)之间的关系,也能描述响应变量和多个解释变量之间的关系,比较不同衡量尺度的变量之间的相互影响,帮助研究者、数据分析人员更深入分析变量之间联系。 考虑种河北春小麦的某户收入: 变量:某户收入(元)、土地(亩) 关系:某户收入 = 1500元/亩*10亩 = 15000元 河北春小麦亩产量设定为1000斤(一般在800斤……

    张龙 - 2024年8月14日 17:11


    数据变换

    7.4.1 基础概念 在数据经过清理、集成与归约等步骤后,很可能需要进一步将数据进行规范化、离散化、分层化等操作,以提高模型拟合的程度,或使原始属性能够被更抽象或更高层次的概念代替。这些方法统一可以称为数据变换(Data Transform)。 ==数据变换==: 数据变换是采用线性或非线性的数学变换方法,将数据从一种表示形式变为另一种表现形式,以适合于各种数据挖掘模式的过程,使数据挖掘的……

    张龙 - 2024年8月14日 16:38


    第十六章 数据可视化

    ```mindmap 数据可视化 数据可视化的基础知识 可视化设计基础 数据可视化工具 ``` 数据可视化的基础知识 定义:数据可视化使用图形表示法来展示数据,使观察者能够快速识别模式、趋势和异常。 目的:其主要目的是简化复杂数据的解释,强调数据中的重要特征,或揭示数据间的潜在关系。 可视化设计基础 视觉编码:数据的属性通过视觉通道(如颜色、形状、大小)进行编码。 图表类型:根据数据的特点……

    张龙 - 2024年8月14日 16:32



    张龙