• 一个完整的机器学习项目一般流程包括: 
    1、抽象成数学问题

      首先要明确问题,分类还是回归,尽量避免胡乱尝试;

    2、数据获取及分析

      获取的数据要有代表性,否则必然会过拟合。 
      而且对于分类问题,数据偏斜不能过于严重,不同类别的数据数量不要有数个数量级的差距。 而且还要对数据的量级有一个评估,多少个样本,多少个特征,可以估算出其对内存的消耗程度,判断训练过程中内存是否能够放得下。如果放不下就得考虑改进算法或者使用一些降维的技巧了。如果数据量实在太大,那就要考虑分布式了。

    3、数据预处理

      数据清洗、数据归一化、扩充等。归一化、离散化、因子化、缺失值处理、去除共线性等,数据挖掘过程中很多时间就花在它们上面。这些工作简单可复制,收益稳定可预期,是机器学习的基础必备步骤。

    4、特征工程

      筛选出显著特征、摒弃非显著特征,需要机器学习工程师反复理解业务。这对很多结果有决定性的影响。特征选择好了,非常简单的算法也能得出良好、稳定的结果。这需要运用特征有效性分析的相关技术,如相关系数、卡方检验、平均互信息、条件熵、后验概率、逻辑回归权重等方法。

    5、训练模型选择与调优

      要根据数据的实际情况和具体要解决的问题来选择模型,比如样本数、特征维度,数据特征综合考虑;要解决的问题是分类还是回归,问题需要网络去关注哪方面,结合实际情况选择网络。

      调优问题,可以采用交差验证,观察损失曲线,测试结果曲线等分析原因,调节参数:优化器、学习率、batchsize等

      可以尝试多模型融合,来提高效果。

    6、后处理

      网络的到的结果一般不直接使用,通过一些后处理方案,不如加入先验约束,一些处理,将明显错误去除。

    7、模型评估

      从各个方面评估,模型准确率、误差,时间、空间复杂度,稳定性、迁移性等

独孤求败 —— 什么才是一个完整机器学习项目流程? 适合九成以上的场景相关推荐

  1. BAT面试题13:请简要说说一个完整机器学习项目的流程

    BAT面试题13:请简要说说一个完整机器学习项目的流程 https://mp.weixin.qq.com/s/HiqC1MCb5TEBUxjiYvB7bA 摘要:本文描述机器学习任务的"OO ...

  2. 简要说说一个完整机器学习项目的流程

    1 抽象成数学问题 明确问题是进行机器学习的第一步.机器学习的训练过程通常都是一件非常耗时的事情,胡乱尝试时间成本是非常高的. 这里的抽象成数学问题,指的我们明确我们可以获得什么样的数据,目标是一个分 ...

  3. 算法工程师面试备战笔记2_一个完整机器学习项目的流程

    1 抽象成数学问题 明确问题是进行机器学习的第一步.机器学习的训练过程通常都是一件非常耗时的事情,胡乱尝试时间成本是非常高的. 这里的抽象成数学问题,指的我们明确我们可以获得什么样的数据,目标是一个分 ...

  4. 人工智能概述、人工智能发展历程、人工智能主要分支、机器学习工作流程、完整机器学习项目的流程、机器学习算法分类、独立同分布、模型评估、深度学习简介

    日萌社 人工智能AI:Keras PyTorch MXNet TensorFlow PaddlePaddle 深度学习实战(不定时更新) 1.1 人工智能概述 1 人工智能应用场景 2 人工智能小案例 ...

  5. 【集成学习-组队学习】2.使用sklearn构建完整的机器学习项目流程

    使用sklearn构建完整的机器学习项目流程 组队学习来源: Datewhle23期__集成学习(上) : https://github.com/datawhalechina/team-learnin ...

  6. 【2021.03--集成学习(上)】使用 sklearn 构建完整的机器学习项目流程

    本次 DataWhale 第二十三期组队学习,其开源内容的链接为:[https://github.com/datawhalechina/team-learning-data-mining/tree/m ...

  7. 测试环境搭建流程_案例解析:一个完整的项目测试方案流程,应该是怎么的?...

    作为一名软件测试工程师,为项目制作完成的测试方案并执行,是我们日常工作的重要部分,同时,也是一名合格的软件测试工程师应有的专业素养.那么,很多小白和测试新手肯定要问了:一个完整的项目测试方案流程,应该 ...

  8. FX5u控制4个伺服,一个完整的项目 程序用 标签分层,说明了定位控制中的公共参数设定、回原点、

    FX5u控制4个伺服,一个完整的项目 程序用 标签分层,说明了定位控制中的公共参数设定.回原点.JOG手动.绝对定位.相对定位.控制等部分,威纶程序报警界面.多个机种选择,手动,自动,暂停,包括有: ...

  9. vue.js — 安装Webpake创建一个完整的项目并上传至码云

    vue.js - 安装Webpake创建一个完整的项目并上传至码云 今天总结一下之前几天学习的一整套的创建项目方法: 前提条件:已安装node.js.npm/cnpm最新版本.vue-cli. VS ...

  10. FX5u控制4个伺服,一个完整的项目 回原点、JOG手动、绝对定位、相对定位、控制等部分

    FX5u控制4个伺服,一个完整的项目 程序用 标签分层,说明了定位控制中的公共参数设定.回原点.JOG手动.绝对定位.相对定位.控制等部分,威纶程序报警界面.多个机种选择,手动,自动,暂停,包括有: ...

最新文章

  1. python 图片 转 pdf
  2. C语言表达式和运算符大学霸IT达人
  3. 典型案例:TL的困局,自己忙不过来,团队没有结果
  4. phpul 无序列表,PHP – 简单嵌套无序列表(UL)数组
  5. DeepWalk: Online Learning of Social Representations-2
  6. Android 数据Parcel序列化过程源码分析
  7. MongoTemplate 关于 insert 和 save 函数的区别
  8. Reactive MySQL Client
  9. Iphone隐藏和显示TabBar的方法
  10. Params属性的用法 (beginner)
  11. sklearn中xgboost模块的XGBClassifier函数
  12. Chrome 76.0.3809.100(正式版本) (64 位) 版本 77.0.3865.90不显示网址中的www怎么解决...
  13. c语言游戏计算器代码,C语言计算器代码.doc
  14. ISO_7637-1/2/3/4/5标准各部分修订状态汇总(Road vehicles-Electrical disturbances from conduction and coupling)
  15. 算法竞赛入门经典(刘汝佳)——基础篇心得
  16. matplotlib堆积图
  17. AI后门检测论文翻译:Universal Litmus Patterns: Revealing Backdoor Attacks in CNNs
  18. 【Excel】用公式提取Excel单元格中的汉字
  19. 小说作者推荐:忘却的悠合集
  20. 了解更多全国各地浴室5×8装修图片

热门文章

  1. 分享一款实用的太阳能充电电路(室内光照可用)
  2. 个税计算器python代码_用python写一个北京市的个税计算器
  3. matlab车牌识别错误,matlab车牌识别调入切割函数后就不出图了?也没有显示错误...
  4. C语言编程练习 7.13个人围成一圈,从第1个人开始顺序报号1、2、3,凡报到3的人退出圈子。
  5. 11.25 AtCoder Beginner Contest 129
  6. C语言程序出现malloc(): corrupted top size异常中止
  7. 多媒体大作业 ps+flash
  8. OpenCVSharp学习(十二):图片的逻辑运算
  9. Heat Map在生物信息学中的应用
  10. 【修复收藏功能、更新登录接口】知识付费小程序、博客小程序、完整版开源源码、资源变现小程序