算法与业务结合的开发步骤:业务理解->数据探索->特征工程->模型训练->模型验证->特征优化->模型融和。其中蕴含着模型的重构与参数的优化。

实际业务场景应用机器学习,有不同的步骤,但分类不同。最初认为机器学习只有如下步骤:

但经过阅读和认知的提升发现,建模过程实际上是个不断迭代的过程,归纳总结如下:

  • 业务理解:顾名思义,将业务场景转为抽象的表达,即目标是什么、数据在哪里、对结果如何评估 ;
  • 数据探索:数据清洗、发掘潜在的结构、提取变量,为特征工程做准备;
  • 特征工程:该步骤很关键,包括特征选择、特征构造;
  • 单模型训练:调包or自行编写算法(频率派算法、贝叶斯派算法)解决问题;
  • 模型验证:交叉检验;
  • 特征优化:构造(合成、创造)新的特征;
  • 模型融和:多模型(bagging、boosting、stacking)效果更佳。

需要补充的是,单模型训练完毕后仍需要特征优化;模型融和后仍旧需要进行模型验证。

参考文献:

[1]天池平台. 阿里云天池大赛赛题解析[M]. 电子工业出版社, 2020.

【啃书】【阿里云天池大赛赛题解析】目录相关推荐

  1. 国内首本数据竞赛图书《阿里云天池大赛赛题解析——机器学习篇》今日开启预售!

    天池平台已经举办了超过 200 场来自真实业务场景的竞赛,每场赛事沉淀的课题和数据集,将在天池保留和开放.天池平台已成为在校学生踏入职场前的虚拟实践基地,也成为聚集40万数据人才,孵化2000余家数据 ...

  2. 阿里云天池大赛赛题解析——机器学习篇 | 留言赠书

    国内第一本针对竞赛实操的图书:<阿里云天池大赛赛题解析--机器学习篇>,正式发售. 阿里云天池7年200多场数据大赛精华提取录 为什么写这本书 七年前,天池团队的几名创始成员带着" ...

  3. 阿里云天池大赛赛题解析——机器学习篇

    阿里云天池大赛赛题解析--机器学习篇 (豆瓣)图书阿里云天池大赛赛题解析--机器学习篇 介绍.书评.论坛及推荐 https://book.douban.com/subject/35192976/ 阿里 ...

  4. 【读书向】阿里云天池大赛赛题解析——总结

    [读书向]阿里云天池大赛赛题解析--总结 目录 [读书向]阿里云天池大赛赛题解析--总结 [读书向]阿里云天池大赛赛题解析--可视化 [读书向]阿里云天池大赛赛题解析--特征工程 [读书向]阿里云天池 ...

  5. 【赠书】阿里云天池大赛赛题解析,深度学习篇!

    ‍‍ 阿里云天池作为国内知名的竞赛平台和AI社区,自诞生以来就一直秉持着让更多人公平获得大数据的理念.也正因此,天池每场经典赛事沉淀的课题和数据集都会永久保留和开放.截至目前,天池平台已举办了超过20 ...

  6. 阿里云天池大赛赛题解析――深度学习篇

    作者:天池平台 出版社:电子工业出版社 品牌:电子工业出版社 出版时间:2021-09-01 阿里云天池大赛赛题解析――深度学习篇

  7. 【读书向】阿里云天池大赛赛题解析——可视化

    [读书向]阿里云天池大赛赛题解析--可视化 目录 [读书向]阿里云天池大赛赛题解析--可视化 箱型图 获取异常数据的函数 直方图和Q-Q图 KDE分布图 线性回归图 特征变量的相关性 Box-Cox变 ...

  8. 阿里云天池大赛赛题解析——深度学习篇

    阿里云天池大赛赛题解析--深度学习篇 (豆瓣)图书阿里云天池大赛赛题解析--深度学习篇 介绍.书评.论坛及推荐 https://book.douban.com/subject/35596114/

  9. 阿里云天池大赛赛题解析(深度学习篇)--阅读笔记1--赛题一

    阿里云天池大赛赛题解析(深度学习篇)–阅读笔记1 [x]表示遇到不懂的知识,将在[知识补充]给出具体讲解. 文章目录 阿里云天池大赛赛题解析(深度学习篇)--阅读笔记1 前言 赛题一 瑞金医院MMC人 ...

最新文章

  1. 中国移动将向广大开发者开放了SDK/API等开发工具
  2. html文本打印lt;igt;字段,Web前端学习第九课,使用文本格式化标签
  3. zookeeper出现Error contacting service. It is probably not running.
  4. 解决: Caused by: java.lang.IllegalStateException: Cannot load driver class: com.mysql.jdbc.Driver
  5. mysql 360 atlas_360 Atlas中间件安装及使用
  6. 数据库的基本概念(三大范式,数据)
  7. 通达信波段王指标公式主图_通达信波段王+精准买卖提示主图指标公式
  8. 软件园区网络设计之网络总体设计
  9. ubuntu串口调试工具RS485
  10. PostgreSQL 字典表设计
  11. C++入门基础之计算使用某快递公司运输货物的运费
  12. 鸿蒙系统 安卓碎片化,鸿蒙系统讲解决安卓碎片化问题,4G流畅度媲美12G!
  13. matlab对数据的量化分析方法,金融量化分析数据传输方法与流程
  14. 【audio】耳机插拔/线控按键识别流程
  15. 第31届国际信息学奥林匹克竞赛真题-2019-
  16. 经典算法题:二分查找
  17. 5.5 时间序列预测
  18. Mixamo生成模型导入Unreal4使用官方动画包
  19. dependency problems
  20. Talend API Tester - Free Edition插件安装后不能使用

热门文章

  1. 为什么互联网巨头热衷“年终盘点”?
  2. 【C语言】#和##的作用
  3. Git 工作中怎么用?
  4. HTTP的常用方法、GET和POST的区别
  5. C语言中变量和函数的声明与定义
  6. Python urlparse总结
  7. 用于深度神经网络的语音信号预处理
  8. 数据库中候选键的确定
  9. html5 游戏制作教程,【整理】一步一步学做HTML5游戏教程
  10. VSCode 自动检查代码出错Vetur