预测性分析

分类

  1. 决策树算法
    计算步骤:
    选择对象的一个特征,并根据这一特征对训练集进行分类
    计算某特征分类后分类结果的混乱程度 (使用基尼系数,系数越小越接近根结点)

     以混乱程度最低为原则,确定最佳节点删除不必要的节点生成模型进行预测
    
  2. 随机森林算法

  3. KNN-最近邻分类算法

  4. 神经网络算法

聚类

仅依据数据中发现的描述对象的特征,将数据进行分组,其目标是,组内的对象相互间是相似的,面不同组之间的对象是不同的

  1. K-means
    是以最小误差函数的值最小为目标,按照预设的分类数量,采用距离作为相似性的评价指标,认为两个对象的距离越近,其相似度越大
    常用计算距离方式:

    1. K-中心点
    2. 多层次聚类

关联分析

关联分析是发现隐藏在大型数据集下有意义的联系
分析步骤:
1. 支持度计数: 项 X,Y 同时出现的次数
2. 计算支持度:支持度 = 项 X,Y同时出现的次数/事务库的事务总数
3. 置信度计数:计算项Y在项X出现的事物中出现的次数
4. 计算置信度:项Y在项X中出的事物置信度= (X,Y)的置信度计数/项X出现的次数
5. 确定频繁项集:按照预告设定的支持度和置信度确定频繁项集

难点:如何快速发现频繁项集
常用算法:
APriori: 最常用也是最经典的关联分析算法,其核心是通过连接产生候选项集和其支持度,然后通过剪枝产生频繁项集
FP-Tree

APriori算法
核心目标:降低产生频繁项集的复杂度
核心思想:
1. 如果一个项集是频繁的,那么它的所有子集都是频繁的
2. 如果一个项集是非频繁的,那么它的所有超集也是非频繁的
步骤:
1. 寻找频繁项集
2. 计算置信度

离群点检测

检测方法:

  1. 基于统计
    大部分的基于统计的离群点检测方法是构建一个概率分布模型,并计算对象符合该模型的概率,把具有低概率的对象视为离群点
    拉伊达准则
    3 ∂原则
    等概率准则
    拉格布斯准则
    箱型图
  2. 基于邻近度
    通常可以在数据对象之间定义邻近性度量,把远离大部分的对象视为离群点
  3. 基于密度
    考虑数据可能存在于不同密度区域这一事实,从基于密度观点分析,离群点是在低密度区域中的对象,一个对象的离群点得分是该对象周围密度的逆

06数据分析 - 预测性分析相关推荐

  1. 大数据可视化分析以及预测性分析方法

    摘要:大数据分析要实现的应用领域之一就是预测性分析,可视化分析和数据挖掘都是前期铺垫工作,只要在大数据中挖掘出信息的特点与联系,就可以建立科学的数据模型,通过模型带入新的数据,从而预测未来的数据. 大 ...

  2. 预测性分析及常用预测方法

    预测性分析及常用的预测方法 预测的目的 数据分析最重要的目的就是从数据中寻找规律,找到能够指导我们未来实践的原则和方法,是产生智慧的主要途径.所以预测分析是数据分析的终极目的.虽然数据分析承担了很多功 ...

  3. 一文看懂描述性分析、诊断性分析、预测性分析、指导性分析

    Gartner(象限)将商业数据分析定义为:描述性分析.诊断性分析.预测性分析.指导性分析 描述性分析.诊断性分析.预测性分析.指导性分析是数据分析的四个基本方向. 描述性分析 描述性分析是数据分析的 ...

  4. spss连接mysql_通过结合使用 SPSS 与数据库仓库连接开展预测性分析

    IBM SPSS Modeler 提供预测性分析,可帮助您发现数据模式,提高预测准确性,并改进决策.本教程演示了在 Watson Studio 上使用 SPSS Modeler 的端到端流程:在 Db ...

  5. 大数据分析应用领域之预测性分析

    什么是大数据预测: 大数据的本质是解决问题,大数据的核心价值就在于预测,而企业经营的核心也是基于预测而做出正确判断. 大数据预测让分析从"面向已经发生的过去"转向"面向即 ...

  6. 05 数据分析 - 诊断性分析方法

    诊断性分析: 根据业务逻辑,通过数据寻找引起最终结果的原因和可以改变未来结果的方法 分析目的 解决问题 坏的结果 -> 产生问题的原因和解决的方案 发现机会 好的结果 -> 在机会出现的时 ...

  7. 原创 | 看过《中国机长》,我开始关心航空预测性维修这件事了

    看过<中国机长>的朋友,一定对当时机长精湛的驾驶技术和临危不乱的处置记忆深刻.同时,也对风挡玻璃的突发失效有些担忧.那么在不远的将来,有没有办法能够预知并解决这类问题呢? 随着工业物联网. ...

  8. 数据分析预测的方法有哪些

    数据分析预测也有多种不同的方法,特别是对于刚参与数据分析预测的人来说,也需要了解应该掌握什么样的能力和数据的价值.数据分析和预测是一项重要的内容,其中也将使用四维分析.但是也一定要了解数据分析预测用哪 ...

  9. 数据分析必备 | 逻辑思维分析方法

    本文由作者 Wise Wong 于社区发布 数据分析的下限,取决于逻辑归纳.与其说提高分析质量,不如说提升逻辑归纳能力. 逻辑归纳,需要拥有良好的逻辑思维,并结合领域知识形成该领域的分析方法.而领域方 ...

最新文章

  1. 基于深度学习的视觉三维重建研究总结
  2. 商品和服务税收分类编码导出_谨慎选择加拿大商标的商品和服务分类!否则支付额外费用...
  3. matlab fittype 求不出参数,[转]matlab 中fit fittype
  4. Linux常用目录说明
  5. 用Java编写模仿的太阳系(九星行旋转)--原创
  6. PostgreSQL 11 1Kw TPCC , 1亿 TPCB 7*24 强压耐久测试
  7. [洛谷P1341]无序字母对
  8. ubuntu开机自动关闭独显,使用集成显卡
  9. Linux【环境部署 02】yum源镜像下载+挂载镜像+本地yum源配置+局域网yum源服务搭建+局域网yum源使用(一篇学会离线yum源配置)
  10. Mac OS 开机密码重置
  11. eclipse 使用 git合并develop分支到master分支步骤
  12. 【JZOJ6441】【GDOI2020模拟01.17】小 ω 维护序列
  13. Circular/Linear Convolution 与 DFT
  14. canvas画圆环(一)之渐变色,纯色
  15. 皕杰报表之小程序代码质量检测
  16. 安利一款报表工具,Smartbi解决了Excel做报表的痛点
  17. C语言丨运算符号的三种用法(有示例代码)
  18. Java字符串相似度匹配
  19. spss statistics26 下载及安装教程
  20. java.lang.IllegalStateException异常原因和解决

热门文章

  1. 【Windows 安装JDK8】如何安装java JDK8
  2. 主机地址、网络地址、主机路由、网络路由
  3. Comparable 和 Comparator 比较器
  4. 一文弄懂Redis慢查询
  5. Python 为什么list不能作为字典的key?
  6. 配电站智能巡检机器人,电力智能巡检机器人
  7. vue笔记:父子传值奥利给!
  8. java实现平衡二叉树
  9. Unity-AR 简介
  10. Spark Mllib里的分布式矩阵(行矩阵、带有行索引的行矩阵、坐标矩阵和块矩阵概念、构成)(图文详解)...