下面介绍十种数据挖掘(Data Mining)的分析方法,以便于大家对模型的初步了解,这些都是日常挖掘中经常遇到的算法,希望对大家有用!(甚至有数据挖掘公司,用其中的一种算法就能独步天下)

  1、基于历史的MBR分析(Memory-Based Reasoning;MBR)

基于历史的MBR分析方法最主要的概念是用已知的案例(case)来预测未来案例的一些属性(attribute),通常找寻最相似的案例来做比较。

记忆基础推理法中有两个主要的要素,分别为距离函数(distance function)与结合函数(combination function)。距离函数的用意在找出最相似的案例;结合函数则将相似案例的属性结合起来,以供预测之用。记忆基础推理法的优点是它容许各种型态的数 据,这些数据不需服从某些假设。另一个优点是其具备学习能力,它能藉由旧案例的学习来获取关于新案例的知识。较令人诟病的是它需要大量的历史数据,有足够 的历史数据方能做良好的预测。此外记忆基础推理法在处理上亦较为费时,不易发现最佳的距离函数与结合函数。其可应用的范围包括欺骗行为的侦测、客户反应预 测、医学诊疗、反应的归类等方面。

  2、购物篮分析(Market Basket Analysis)

购物篮分析最主要的目的在于找出什么样的东西应该放在一起?商业上的应用在藉由顾客的购买行为来了解是什么样的顾客以及这些顾客为什么买这些产品,找出相 关的联想(association)规则,企业藉由这些规则的挖掘获得利益与建立竞争优势。举例来说,零售店可藉由此分析改变置物架上的商品排列或是设计 吸引客户的商业套餐等等。

购物篮分析基本运作过程包含下列三点:

(1)选择正确的品项:这里所指的正确乃是针对企业体而言,必须要在数以百计、千计品项中选择出真正有用的品项出来。

(2)经由对共同发生矩阵(co-occurrence matrix)的探讨挖掘出联想规则。

(3)克服实际上的限制:所选择的品项愈多,计算所耗费的资源与时间愈久(呈现指数递增),此时必须运用一些技术以降低资源与时间的损耗。

购物篮分析技术可以应用在下列问题上:

(1)针对信用卡购物,能够预测未来顾客可能购买什么。

(2)对于电信与金融服务业而言,经由购物篮分析能够设计不同的服务组合以扩大利润。

(3)保险业能藉由购物篮分析侦测出可能不寻常的投保组合并作预防。

(4)对病人而言,在疗程的组合上,购物篮分析能作为是否这些疗程组合会导致并发症的判断依据。

  3、决策树(Decision Trees)

决策树在解决归类与预测上有着极强的能力,它以法则的方式表达,而这些法则则以一连串的问题表示出来,经由不断询问问题最终能导出所需的结果。典型的决策 树顶端是一个树根,底部有许多的树叶,它将纪录分解成不同的子集,每个子集中的字段可能都包含一个简单的法则。此外,决策树可能有着不同的外型,例如二元 树、三元树或混和的决策树型态。

 4、遗传算法(Genetic Algorithm)

遗传算法学习细胞演化的过程,细胞间可经由不断的选择、复制、交配、突变产生更佳的新细胞。基因算法的运作方式也很类似,它必须预先建立好一个模式,再经 由一连串类似产生新细胞过程的运作,利用适合函数(fitness function)决定所产生的后代是否与这个模式吻合,最后仅有最吻合的结果能够存活,这个程序一直运作直到此函数收敛到最佳解。基因算法在群集 (cluster)问题上有不错的表现,一般可用来辅助记忆基础推理法与类神经网络的应用。

  5、聚类分析(Cluster Detection)

这个技术涵盖范围相当广泛,包含基因算法、类神经网络、统计学中的群集分析都有这个功能。它的目标为找出数据中以前未知的相似群体,在许许多多的分析中,刚开始都运用到群集侦测技术,以作为研究的开端。

6、连接分析(Link Analysis)

连接分析是以数学中之图形理论(graph theory)为基础,藉由记录之间的关系发展出一个模式,它是以关系为主体,由人与人、物与物或是人与物的关系发展出相当多的应用。例如电信服务业可藉 连结分析收集到顾客使用电话的时间与频率,进而推断顾客使用偏好为何,提出有利于公司的方案。除了电信业之外,愈来愈多的营销业者亦利用连结分析做有利于 企业的研究。

  7、OLAP分析(On-Line Analytic Processing;OLAP)

严格说起来,OLAP分析并不算特别的一个数据挖掘技术,但是透过在线分析处理工具,使用者能更清楚的了解数据所隐藏的潜在意涵。如同一些视觉处理技术一般,透过图表或图形等方式显现,对一般人而言,感觉会更友善。这样的工具亦能辅助将数据转变成信息的目标。

  8、神经网络(Neural Networks)

神经网络是以重复学习的方法,将一串例子交与学习,使其归纳出一足以区分的样式。若面对新的例证,神经网络即可根据其过去学习的成果归纳后,推导出新的结果,乃属于机器学习的一种。数据挖掘的相关问题也可采类神经学习的方式,其学习效果十分正确并可做预测功能。

  9、判别分析(Discriminant Analysis)

当所遭遇问题它的因变量为定性(categorical),而自变量(预测变量)为定量(metric)时,判别分析为一非常适当之技术,通常应用在解决 分类的问题上面。若因变量由两个群体所构成,称之为双群体 —判别分析 (Two-Group Discriminant Analysis);若由多个群体构成,则称之为多元判别分析(Multiple Discriminant Analysis;MDA)。

(1) 找出预测变量的线性组合,使组间变异相对于组内变异的比值为最大,而每一个线性组合与先前已经获得的线性组合均不相关。

(2) 检定各组的重心是否有差异。

(3) 找出哪些预测变量具有最大的区别能力。

(4) 根据新受试者的预测变量数值,将该受试者指派到某一群体。

  10、罗吉斯回归分析(Logistic Analysis)

当判别分析中群体不符合正态分布假设时,罗吉斯回归分析是一个很好的替代方法。罗吉斯回归分析并非预测事件(event)是否发生,而是预测该事件的机 率。它将自变量与因变量的关系假定是S行的形状,当自变量很小时,机率值接近为零;当自变量值慢慢增加时,机率值沿着曲线增加,增加到一定程度时,曲线协 率开始减小,故机率值介于0与1之间。

十种数据挖掘分析法:一种算法就能独步天下相关推荐

  1. rls lms 对比 matlab,自适应均衡器的LMS和RLS两种算法的特性与仿真分析

    自适应均衡属于自适应信号处理的应用范畴,各种各样的自适应均衡算法如迫零(ZF)算法.最小均方(LMS)算法.递归最小二乘(RLS)算法.变换域均衡算法.Bussgang算法.高阶或循环统计量算法.基于 ...

  2. 趋势面法优缺点_趋势面分析法

    一.趋势面分析法 (2007-03-06 14:45:57) 转载 下面将就趋势面分析.克里金.形函数法三种算法作简单介绍,以后将进一步整理一些资料,介绍更 多优秀的实用算法. 一.趋势面分析法 趋势 ...

  3. python亲和性分析法推荐电影论文_数据挖掘-MovieLens数据集_电影推荐_亲和性分析_Aprioro算法...

    #!/usr/bin/env python2 # -*- coding: utf-8 -*- """ Created on Tue Feb  7 14:38:33 201 ...

  4. 递归下降分析法的基本思想。_还不懂这八大算法思想,刷再多题也白搭!

    各位朋友好久不见呢.最近由于刚入职,作为职场萌新,所以大部分时间都花在了工作上.因而也没有太多时间来写文章啦,这篇文章也是定题了许久,迟迟没有落笔.等之后工作慢慢稳定,业务熟练起来,文章更新频率就会高 ...

  5. 层次分析法(AHP)算法简介

     一·.模型介绍 层次分析法(AHP)是美国运筹学家萨蒂于上世纪70年代初,为美国国防部研究"根据各个工业部门对国家福利的贡献大小而进行电力分配"课题时,应用网络系统理论和多目标综 ...

  6. 软件项目管理:成本估算法,PERT历时估算法,决策树分析法,挣值分析法

    1,成本估计法 1.1,专家估算法 很简单,就是一群专家说几个数字,然后按照  的公式计算成本. :乐观估计 :正常估计 :悲观估计 题目:项目经理正在进行一个图书馆信息查询系统的项目估算,他采用De ...

  7. 层次分析法-基于节点关键度的DTN路由算法

    当你看到一个知识点的时候,不是收藏和点赞,而是想办法转化成自己需要的知识,好记性不如烂笔头. 层次分析法 层次分析法(运筹学理论),简称AHP,是指将于决策总是有关的元素分解成目标.准则.方案等层次, ...

  8. 鱼骨图分析法实际案例_让你头脑更精明的十种思考法:鱼骨图

    鱼骨图又名特性因素图是由日本管理大师石川馨先生所发展出来的,故又名石川图.鱼骨图是一种发现问题"根本原因"的方法,它也可以称之为"因果图".鱼骨图原本用于质量管 ...

  9. MATLAB数学建模必备算法--层次分析法AHP

    其主要用于解决评价类问题(例如:选择哪种方案最好.哪位运动员或者员工表现的更优秀) 一个很典型的层次分析法案例: 确定评价目标: 高考完后小明想要去旅游,有三个目的地供他选择: 苏杭 北戴河 桂林 确 ...

最新文章

  1. MIS开发中.net Framework的打印功能
  2. /dev/rdsk 与 /dev/dsk区别
  3. 《利用Python》进行数据分析:Numpy基础9 数组转置和轴对换
  4. 主键由数据库mysql 映射native_Hibernate主键生成策略详解
  5. 机器学习算法与Python实践之(三)支持向量机(SVM)进阶
  6. react组件设计原则_React组件设计规则
  7. python数据分析与基础实战_《python数据分析与挖掘实战》基础概念
  8. 保存hbitmap到文件
  9. PAT1015 德才论(C++)
  10. AndroidStudio安卓原生开发_Activity_中Activity显示/隐式启动Action和Category配置详解---Android原生开发工作笔记84
  11. [Server] HP DL380 G6更新esxi6.0 SATA 硬盘掉线问题
  12. 使用合取范式进行整数规划建模的方法
  13. python网页提交表单_python模拟实现自动填写网页表单源码
  14. 鸿蒙系统4月24日升级哪几款手机,大器晚成!鸿蒙系统或4月24号推送更新,你的机型在内吗?...
  15. 分组和聚合函数的组合使用实操
  16. sodo 赋予非管理员用户临时权限
  17. 日落20181125001 - UGUI组件应用之Animation和CanvasGroup制作渐现渐隐效果
  18. 如何排版 微信公众号「代码块」之 MarkEditor
  19. 【狂神说Java】视频笔记
  20. Web端算法部署+流媒体服务器算法部署+Flask+AI健身+Python-web实时检测效果显示

热门文章

  1. 在Excel中根据条件查找匹配多个值
  2. 【IBM官方文档】DB2 SQLSTATE 消息
  3. 机器人xacro设计+gazebo/rviz启动
  4. 九个问题从入门到熟悉HTTPS
  5. Layui禁用按钮,Layui禁用且隐藏按钮
  6. 模仿天天动听5可联网下载歌词的音乐播放器
  7. 遗传算法求函数最小值(多维)2
  8. (转) 值得关注的开源软件推荐
  9. 插件 | 蛋白序列集合功能注释快速完成 - Quick Protein Anno
  10. 【区块链技术与应用】(四)