CRISP-DM模型
整理笔记,记一下~
框架
内容
业务理解(Business Understanding)
深刻理解业务需求,在需求的基础上制定目标和实现目标的计划
数据理解(Data Understanding)
主要为收集数据、熟悉数据、识别数据的质量问题。
数据准备(Data Preparation)
从收集的数据种选择必要的属性,并按关联关系将它们连接成一个数据集,然后进行数据清洗,如空值和异常值处理、离群值剔除和数据标准化。
建模(Modeling)
选择和应用不同的模型技术,并确定模型的最佳参数。如果初步分析发现模型的效果不满意,要跳回数据准备阶段,甚至数据理解阶段。
评估(Evaluation)
对建立的模型进行可靠性评估和合理性解释。检查构造模型的步骤,确保模型可以完成业务目标。如果评估结果没有达到预想的业务目标,要再跳回业务理解阶段。
部署(Deployment)
根据评估后认为合理的模型,制定将其应用于实际工作的策略。
CRISP-DM模型相关推荐
- uboot DM模型
DM即driver module,也就是驱动模型. uboot为什么引入驱动模型呢?驱动模型又是一个怎样的一个模型呢?第一个问题很简单,既然uboot要引入驱动模型,那肯定是因为驱动模型要比老旧的驱动 ...
- u-boot下的DM驱动模型
U-boot 下DM驱动模型的相关笔记 要注意的关键两点: DM驱动模型的一般流程bind->ofdata_to_platdata(可选)->probe 启动,bind操作时单独完成的,主 ...
- Uboot中的DM驱动模型
这一篇我们学习uboot中的驱动模型的初始化,在uboot中,驱动模型被称为Driver Model,简称DM.这种驱动模型为uboot中的各类驱动提供了统一的接口. 1. 数据结构及概念 DM模型主 ...
- 【Python自然语言处理】文本向量化的六种常见模型讲解(独热编码、词袋模型、词频-逆文档频率模型、N元模型、单词-向量模型、文档-向量模型)
觉得有帮助请点赞关注收藏~~~ 一.文本向量化 文本向量化:将文本信息表示成能够表达文本语义的向量,是用数值向量来表示文本的语义. 词嵌入(Word Embedding):一种将文本中的词转换成数字向 ...
- 基于多模型融合的用户画像分析统计方法研究
摘 要 随着信息技术的快速发展和大数据技术的广泛应用,企业的营销和产品的设计,对精细化.精准化的要求越来越高.主流的电商平台.搜索引擎以及短视频平台均推出了基于用户画像的个性化推荐服务,这其中相当一 ...
- 【uboot】uboot 2020.04 DM驱动模式 -- Demo体验
文章目录 1. 前言 2. uboot的驱动模型简介 3. U_BOOT_CMD(do_demo)分析 4. 执行命令demo list 5. 执行命令demo hello 6. 执行命令demo l ...
- Uboot DM_USB与DM_ETH模型
技术背景 详细有学习过Linux驱动的小伙伴,都知道相应的总线驱动模型吧.学习驱动都是先从硬编码,到设备驱动模型的历程,这样能让代码尽可能少的改动,即可支持一系列的设备.在较新的Uboot中,已经有成 ...
- word2vec损失函数的数学推导和近似训练以及doc2vec的实战掉包应用
更新: 9/4/20 做了关于SG模型最后计算loss的一些补充.对doc2vec损失计算部分出现的错误进行了订正. 11/17/20 补充了部分近似训练的内容. 词义表示 在NLP中,最基础的问题就 ...
- Recovery Rate违约后可回收比率
http://baike.baidu.com/view/136771.htm 信用风险管理,指的是针对交易对手.借款人或债券发行人 要加强思想道德教育 具有违约"可能性"所产生的风 ...
- 【Pytorch神经网络实战案例】18 最大化深度互信信息模型DIM实现搜索最相关与最不相关的图片
图片搜索器分为图片的特征提取和匹配两部分,其中图片的特征提取是关键.将使用一种基于无监督模型的提取特征的方法实现特征提取,即最大化深度互信息(DeepInfoMax,DIM)方法. 1 最大深度互信信 ...
最新文章
- AngularJS 深入理解 $scope 转载▼
- JDBC连接MySQL
- JavaAppArguments
- 【数据】深度学习从“数据集”开始
- python 形参_python中参数总结
- vlookup练习_大胆合并吧!VLOOKUP坐字法专做单元格合并查找
- 单基因GSEA怎么做?
- 从LeNet到SENet——卷积神经网络回顾
- 发送邮件现在应用得最多的两种情况就是利用.NET自带的发送邮件和利用jmail组件来发送邮件。...
- 三大工艺因素影响百万像素镜头成像质量
- 《流畅的Python》读书笔记——Python函数装饰器和闭包
- MyBatis #{ } ${ }
- 构建微服务体系结构的最佳实践
- diy手工制作泡沫小球_一撮羊毛用针来回的戳,DIY手工制作羊毛毡小动物,越戳越带劲...
- Android官方文档中文版
- python使用Jpype调用java程序
- win10内存占用率过高怎么办_内存占用率过高怎么办?Win10电脑内存占用率很高原因和解决方法...
- 如何临时删除桌面右键菜单上的登录画面修改
- 中职生计算机基础知识总结,浅谈中职学生的计算机基础教育
- 双层循环遍历 减少时间复杂度
热门文章
- 【Flink异常】Caused by: java.lang.RuntimeException: Row arity of from does not match serializers
- 红猫linux系统下载教程,RedCat_NSS_红猫linux软路由安装使用手册.doc
- 计算机考研复试-计算机网络
- [Nios][Eclipse] find_fast_cwd: WARNING: Couldn't compute FAST_CWD pointer
- Android 开源的UI框架
- linux systat安装包,Linux下sysstat 安装
- CMIP6数据下载教程大全(含批量)
- 从“AI原生云”,看智能经济时代的新型数字底座
- 27.ORA - 17008
- 天然气气相色谱仪的软件性能分析