CRIP-DM+SEMMA

CRISP-DM (cross-industry standard process for data mining),即为“跨行业数据挖掘过程标准"。

长期以来,随着数据挖掘市场的发展和成熟,由不同的组织机构提出过很多的方法论,如CRISP-DM、SEMMA、5A等,其中CRISP-DM、SEMMA是应用最为广泛。CRISP-DM (cross-industry standard process for data mining),即为“跨行业数据挖掘过程标准"。此KDD过程模型于1999年欧盟机构联合起草. 通过近几年的发展,CRISP-DM 模型在各种KDD过程模型中占据领先位置,采用量达到近60%。排在其后的是由SAS公司提出的SEMMA。SEMMA更偏重于数据挖掘的建模过程,与SAS的EM工具进行整合,其模型管理部署部分则体现在另外的工具套件中。CRISP-DM是从一个数据挖掘项目执行的角度谈方法论,CRISP- DM的考虑的范围比SEMMA 要大。CRISP-DM强调,数据挖掘不单是数据的组织或者呈现,也不仅是数据分析和统计建模,而是一个从理解业务需求、寻求解决方案到接受实践检验的完整过程。因此,从一个项目的管理实施完整流程来说,CRISP-DM更适用一些,本文后续主要以CRISP-DM为主进行详细介绍。

在过去几年,随着信息化技术的高速发展,数据逐渐变为企业最有价值的战略资产,人们迫切希望能够从数据中发掘价值和探索规律,以便为企业在研发、生产、营销、管理、运维等各个环节遇到的问题提供新的解决思路,用数字化战略为企业赋能。

为什么需要一个数据挖掘方法论?

要实现对数据价值的深度发掘,

CRISP-DM (cross-industry standard process for data mining)跨行业数据挖掘过程标准相关推荐

  1. Data Mining Pipeline(数据挖掘实践指南--特征发现,处理与评估)

    –数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限. 故特征工程和数据清洗十分重要.本文以竞赛为目标,以完成实践的数据挖掘任务为导向,需要运用到一系列的处理方法.算法是数据挖掘之魂,但魂魄 ...

  2. A Glance at Secure Multiparty Computation for Privacy Preserving Data Mining论文总结

    A Glance at Secure Multiparty Computation for Privacy Preserving Data Mining论文总结 Abstract I. INTRODU ...

  3. Our Proof : Page Scraping : Website Data Extraction : Data Mining Analytics : Connotate.com

    Our Proof : Page Scraping : Website Data Extraction : Data Mining Analytics : Connotate.com There's ...

  4. 数据挖掘讲座:我所知道的一点Data Mining

    赵民德 2003/01/24 市场竞争的激烈迫使企业高层寻找更为科学.系统.有效的辅助决策技术和整体解决方案来处理日益复杂的公司事务.毫无疑问,数据挖掘就是很好的选择之一.数据挖掘到底是什么?数据挖掘 ...

  5. data mining (foreign blogs)

    出处:http://blog.csdn.net/shuimuqingyi/article/details/8698607 国外数据挖掘方面的经典博客 总体感觉数据挖掘行业在国内尚没有收到足够重视,国内 ...

  6. data mining blog (foreign)

    国外数据挖掘方面的经典博客 总体感觉数据挖掘行业在国内尚没有收到足够重视,国内的相关博客的内容也不够丰富,下面列出了一些国外数据挖掘方面的经典博客.数据挖掘是一个有趣的以及具有足够学术价值和商业价值的 ...

  7. 数据挖掘(data mining),机器学习(machine learning),和人工智能(AI)的区别是什么? 数据科学(data science)和商业分析(business analytics

    数据挖掘(data mining),机器学习(machine learning),和人工智能(AI)的区别是什么? 数据科学(data science)和商业分析(business analytics ...

  8. [转]Data mining with WEKA, Part 3: Nearest Neighbor and server-side library

    原文地址: http://www.ibm.com/developerworks/opensource/library/os-weka3/index.html by :  Michael Abernet ...

  9. 数据挖掘(data mining),机器学习(machine learning),和人工智能(AI)的区别是什么

    数据挖掘(data mining),机器学习(machine learning),和人工智能(AI)的区别是什么? 数据科学(data science)和商业分析(business analytics ...

最新文章

  1. React Native 与 嵌入Android原生与Activity页面互相跳转
  2. kingshard--一个支持sharding的MySQL Proxy项目
  3. matlab遗传算法m文件,matlab上安装遗传算法工具箱
  4. 2年工作经验进 初创公司_沟通是关键:通过两家初创公司获得的成长经验教训+找工作...
  5. 牛逼!计算机基础知识总结与操作系统 PDF 开放下载了!
  6. Confluence 6 PostgreSQL 创建数据库和数据库用户
  7. git merge用法_Git 基本命令 merge 和 rebase,你真的了解吗?
  8. Request.getparameternames有什么用
  9. 药品信息管理系统mysql_药品信息管理系统数据库部分代码
  10. 软件测试周刊(第68期):解决棘手问题的最上乘方法是:静观其变,顺水推舟。
  11. Windows10设置动态桌面壁纸
  12. 华大MCU(五):HC32F460串口IAP升级boot部分
  13. 502 Bad Gateway错误
  14. Linux系统管理----centos7系统进程管理
  15. 牛逼!这个C++跳棋游戏居然可以让你边玩游戏边学编程!
  16. 杭州最新公交线路一览(150-)
  17. pygame模块学习
  18. Normalize.css简书
  19. Semantic Proximity Search on Heterogeneous Graph by Proximity Embedding
  20. 时间戳服务器作用,时间戳服务器

热门文章

  1. 37 函数的定义和调用
  2. mysql 实现yyyyww_java – LocalDate无法使用’yyyy’解析’ww’
  3. 改进YOLO | 可能这才是用Transformer正确打开YOLO的方式吧?
  4. 3D点云补全算法汇总及最新进展
  5. c语言插入排序算法伪代码,排序算法——插入排序(C语言实现)
  6. AAAI | 深度生成模型—NEVAE
  7. Galaxy 生信平台(二):生产环境部署
  8. 在线绘图|2分钟轻松搞定桑基图(Sankey diagrams)
  9. 零基础入门学习Python(10)-列表(2)
  10. 蚂蚁森林最高效的合种团队—招募队友云植树,最快1天1颗树