CRISP-DM (cross-industry standard process for data mining)跨行业数据挖掘过程标准
CRIP-DM+SEMMA
CRISP-DM (cross-industry standard process for data mining),即为“跨行业数据挖掘过程标准"。
长期以来,随着数据挖掘市场的发展和成熟,由不同的组织机构提出过很多的方法论,如CRISP-DM、SEMMA、5A等,其中CRISP-DM、SEMMA是应用最为广泛。CRISP-DM (cross-industry standard process for data mining),即为“跨行业数据挖掘过程标准"。此KDD过程模型于1999年欧盟机构联合起草. 通过近几年的发展,CRISP-DM 模型在各种KDD过程模型中占据领先位置,采用量达到近60%。排在其后的是由SAS公司提出的SEMMA。SEMMA更偏重于数据挖掘的建模过程,与SAS的EM工具进行整合,其模型管理部署部分则体现在另外的工具套件中。CRISP-DM是从一个数据挖掘项目执行的角度谈方法论,CRISP- DM的考虑的范围比SEMMA 要大。CRISP-DM强调,数据挖掘不单是数据的组织或者呈现,也不仅是数据分析和统计建模,而是一个从理解业务需求、寻求解决方案到接受实践检验的完整过程。因此,从一个项目的管理实施完整流程来说,CRISP-DM更适用一些,本文后续主要以CRISP-DM为主进行详细介绍。
在过去几年,随着信息化技术的高速发展,数据逐渐变为企业最有价值的战略资产,人们迫切希望能够从数据中发掘价值和探索规律,以便为企业在研发、生产、营销、管理、运维等各个环节遇到的问题提供新的解决思路,用数字化战略为企业赋能。
为什么需要一个数据挖掘方法论?
要实现对数据价值的深度发掘,
CRISP-DM (cross-industry standard process for data mining)跨行业数据挖掘过程标准相关推荐
- Data Mining Pipeline(数据挖掘实践指南--特征发现,处理与评估)
–数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限. 故特征工程和数据清洗十分重要.本文以竞赛为目标,以完成实践的数据挖掘任务为导向,需要运用到一系列的处理方法.算法是数据挖掘之魂,但魂魄 ...
- A Glance at Secure Multiparty Computation for Privacy Preserving Data Mining论文总结
A Glance at Secure Multiparty Computation for Privacy Preserving Data Mining论文总结 Abstract I. INTRODU ...
- Our Proof : Page Scraping : Website Data Extraction : Data Mining Analytics : Connotate.com
Our Proof : Page Scraping : Website Data Extraction : Data Mining Analytics : Connotate.com There's ...
- 数据挖掘讲座:我所知道的一点Data Mining
赵民德 2003/01/24 市场竞争的激烈迫使企业高层寻找更为科学.系统.有效的辅助决策技术和整体解决方案来处理日益复杂的公司事务.毫无疑问,数据挖掘就是很好的选择之一.数据挖掘到底是什么?数据挖掘 ...
- data mining (foreign blogs)
出处:http://blog.csdn.net/shuimuqingyi/article/details/8698607 国外数据挖掘方面的经典博客 总体感觉数据挖掘行业在国内尚没有收到足够重视,国内 ...
- data mining blog (foreign)
国外数据挖掘方面的经典博客 总体感觉数据挖掘行业在国内尚没有收到足够重视,国内的相关博客的内容也不够丰富,下面列出了一些国外数据挖掘方面的经典博客.数据挖掘是一个有趣的以及具有足够学术价值和商业价值的 ...
- 数据挖掘(data mining),机器学习(machine learning),和人工智能(AI)的区别是什么? 数据科学(data science)和商业分析(business analytics
数据挖掘(data mining),机器学习(machine learning),和人工智能(AI)的区别是什么? 数据科学(data science)和商业分析(business analytics ...
- [转]Data mining with WEKA, Part 3: Nearest Neighbor and server-side library
原文地址: http://www.ibm.com/developerworks/opensource/library/os-weka3/index.html by : Michael Abernet ...
- 数据挖掘(data mining),机器学习(machine learning),和人工智能(AI)的区别是什么
数据挖掘(data mining),机器学习(machine learning),和人工智能(AI)的区别是什么? 数据科学(data science)和商业分析(business analytics ...
最新文章
- React Native 与 嵌入Android原生与Activity页面互相跳转
- kingshard--一个支持sharding的MySQL Proxy项目
- matlab遗传算法m文件,matlab上安装遗传算法工具箱
- 2年工作经验进 初创公司_沟通是关键:通过两家初创公司获得的成长经验教训+找工作...
- 牛逼!计算机基础知识总结与操作系统 PDF 开放下载了!
- Confluence 6 PostgreSQL 创建数据库和数据库用户
- git merge用法_Git 基本命令 merge 和 rebase,你真的了解吗?
- Request.getparameternames有什么用
- 药品信息管理系统mysql_药品信息管理系统数据库部分代码
- 软件测试周刊(第68期):解决棘手问题的最上乘方法是:静观其变,顺水推舟。
- Windows10设置动态桌面壁纸
- 华大MCU(五):HC32F460串口IAP升级boot部分
- 502 Bad Gateway错误
- Linux系统管理----centos7系统进程管理
- 牛逼!这个C++跳棋游戏居然可以让你边玩游戏边学编程!
- 杭州最新公交线路一览(150-)
- pygame模块学习
- Normalize.css简书
- Semantic Proximity Search on Heterogeneous Graph by Proximity Embedding
- 时间戳服务器作用,时间戳服务器
热门文章
- 37 函数的定义和调用
- mysql 实现yyyyww_java – LocalDate无法使用’yyyy’解析’ww’
- 改进YOLO | 可能这才是用Transformer正确打开YOLO的方式吧?
- 3D点云补全算法汇总及最新进展
- c语言插入排序算法伪代码,排序算法——插入排序(C语言实现)
- AAAI | 深度生成模型—NEVAE
- Galaxy 生信平台(二):生产环境部署
- 在线绘图|2分钟轻松搞定桑基图(Sankey diagrams)
- 零基础入门学习Python(10)-列表(2)
- 蚂蚁森林最高效的合种团队—招募队友云植树,最快1天1颗树