2020-01-20 18:06:29

作者:datarevenue

编译:ronghuaiyang

导读

这个checklist能帮助你迈出做一个成功的机器学习项目第一步。

避免混淆,用这个简单的清单来计划你的 AI 项目。

对许多人来说,机器学习仍然是一项新技术,这可能会让它难以管理。

项目经理通常不知道如何与数据科学家谈论他们的想法。

在我们规划 30 多个机器学习项目的经验中,我们提炼出了一个简单有效的checklist。

1. 项目动机

明确你的项目的更广泛的意义。

  • 你要解决的问题是什么?What is the problem you want to solve?
  • 相关联的目标策略是什么?

如果项目团队不理解你的动机,那么他们就很难提出好的建议。

有很多方法可以解决机器学习的问题。所以帮助你的团队以你最感兴趣的方式工作 —— 退一步告诉他们为什么这个项目是重要的。

2. 问题定义

  • 你想要预测的具体输出是什么?

对于给定的输入,你的机器学习模型将理想地学会预测非常具体的输出。

所以这里你要尽可能的清楚。“预测机器故障”可能意味着很多事情 —— “告诉我,在未来 24 小时内,意外停机的风险何时增加 50%以上”更好。

  • 你的算法有什么输入数据?

模型预测输出的唯一方法是从模型的输入因子中派生出来。所以,为了有机会做出好的预测,你必须有与输出相关的数据。数据越多越好。

  • 什么是预测你的具体输出的最相关因素?

算法不能理解我们的世界。重要的是,你要给数据科学家一些提示,告诉他哪些数据实际上是相关的,这样他就可以用算法能够理解的方式选择和分割数据。

  • 你能提供多少训练样本 ?

一个算法需要的练习比一个人要多得多。你最少需要 200 个样本。越多越好。

3. 性能度量

你怎么知道什么是好的结果?

  • 你有一个简单的基准测试来比较你的结果吗?

有没有一种简单的方法来利用你已有的数据进行预测?也许你可以根据去年的数字预测销售额,或者通过计算客户上一次登录后的天数来评估客户离开的风险。一个简单的基准测试可以为你的团队提供有价值的问题洞察力。它给你一些东西来衡量模型。

  • 你将如何衡量预测的准确性 ?
  • 你期望的最低准确度是多少?

你希望预测的准确率平均在 5% 以内,还是更重要的是预测误差不超过 10%?你的模型可以以任何一种方式进行调优。哪种方式更好取决于什么对你来说是重要的。

  • 一个完美的解决方案是什么样的?

即使这对你来说是显而易见的,把它写在纸上也能帮助你理清思路。

  • 是否有参考解决方案(如研究论文)?

如果有人以前解决过类似的问题,就把他们的解决方案当作灵感。这为每个人提供了一个共同的起点,这样他们就可以看到要使用哪些数据,可能会出现哪些问题,以及要尝试哪些算法。

4. 时间线

一个性能验证项目的时间线示例。

  • 是否有截止日期需要注意?
  • 你什么时候需要看到第一个结果?
  • 你想什么时候有一个完整的解决方案?

人工智能解决方案可以无限地改进。明确的最后期限有助于让团队集中精力。

5. 联系人

  • 负责项目(PM)?
  • 谁可以授权访问数据集?
  • 谁能帮助理解当前的流程和/或简单的基准测试(领域专家)?

在一个项目的过程中会出现许多问题。明确你的工程师可以向谁求助。

6. 合作

  • 在业务和工程团队之间建立一个双/周的更新

每周安排一次会议来查看当前的结果,并讨论那些不需要通过电子邮件来回答的问题。

  • 应该涉及谁 ?
  • 他们应该学什么

在学习如何管理人工智能方面,没有什么比实际项目的实践经验更有价值。如果你想让你的团队的其他成员学习,从一开始就要说清楚。

  • 定义代码和问题的位置以及如何访问代码。

让所有的开发从一开始就透明。这样任何人都可以很容易地加入,给出提示,并检查进展。

回答这个清单上的问题,并与大家分享

世界仍在研究如何最好地运行人工智能/机器学习项目。填写这份清单将会给你所有成功的机器学习项目的要素之一:理解。

英文原文:https://www.datarevenue.com/en-blog/machine-learning-project-checklist

做机器学习项目的checklist相关推荐

  1. 我是如何做软件测试项目的?

    最近公司刚完成了一个比较大的项目-单品页模块化,即使用现在比较流行的Twitter Bootstrap进行前端开发.说其大是因为工作量大,开发前期投入约80人日,包括前端开发及PHP开发,且不包括修复 ...

  2. 逃离数学焦虑、算法选择,思考做好机器学习项目的3个核心问题

    机器学习是目前人工智能最令人激动的研究方向之一.我们可能更关注机器学习算法的实现细节,沉浸于机器学习所需要的数学功底,但对于机器学习从业者来说,如何更好更快速的实现一个机器学习项目更值得关注. 正如吴 ...

  3. 解决做好一个机器学习项目的3个问题

    机器学习是目前人工智能最令人激动的研究方向之一.我们可能更关注机器学习算法的实现细节,沉浸于机器学习所需要的数学功底,但对于机器学习从业者来说,如何更好更快速的实现一个机器学习项目更值得关注. 正如吴 ...

  4. 我是如何做Web项目的

    啥都不说了先发个图片. 分层的优势: 1:可以相互协作.网页有美工负责,逻辑有程序员负责.数据库有数据库管理员负责.齐头并进,促进项目进度 2:对于大型系统可以蚂蚁吭大象,逐步解决(当然这是在全局控制 ...

  5. [css] 当拿到一个新的项目,让你对这个项目的css做下架构设计,你该如何下手?

    [css] 当拿到一个新的项目,让你对这个项目的css做下架构设计,你该如何下手? 公共变量(主题色/主要空隙/主要字号字体等) 编译器(scss/less/postcss/stylus) 自适应方案 ...

  6. 10年程序员怒斥:只会八股文没用,公司招你来是做项目的,不是背题的……

    「作者主页」:士别三日wyx 前段时间跟一个老同事去出项目,我请他喝咖啡.闲聊之间得知他已经在这行干了十年并且在北京成家买房,我肃然起敬,啪!的一下就站起来了.同事摆摆手示意我坐下说话,收手的时候顺带 ...

  7. [笔记]解决m2eclipse给项目添加maven依赖管理时可能不给项目的build path...

    为什么80%的码农都做不了架构师?>>>    解决办法:在m2eclipse提供的菜单里关闭项目的Maven依赖管理,然后再启动Maven的依赖管理!!! 检查:1)查看项目的.c ...

  8. 比尔盖茨是这样审查项目的 2

    比尔盖茨是这样审查项目的  2 --选自<软件随想录:程序员部落酋长Joel谈软件> [续]http://blog.csdn.net/turingbooks/archive/2009/12 ...

  9. 比尔盖茨是这样审查项目的 1

    比尔盖茨是这样审查项目的  1 --选自<软件随想录:程序员部落酋长Joel谈软件> 2006 年 6 月 16 日 ,星期五 早先, Excel[1] 有一种没有名字的很蹩脚的编程语言. ...

最新文章

  1. 代码开源!激光雷达 SLAM 的闭环检测:OverlapNet
  2. 计算机二级日期格式,09年计算机二级辅导:指定格式的日期字符串转化成java.util.Date类型日期对象...
  3. torch.Tensor和torch.tensor有什么区别?
  4. 详解Javascript的继承实现
  5. TrackBar问题,有高人能解决吗?
  6. 依存句法分析器的简单实现
  7. Visual Studio 2008 安装失败(“Web 创作组件”)安装失败
  8. 火狐8下,QQ邮箱大附件下载无法识…
  9. 【报告分享】快手私域经营白皮书-磁力引擎(附下载)
  10. SD卡无法识别怎么办?
  11. 逻辑思维强的人适合学计算机不,逻辑思维强的人适合做什么工作?
  12. 重新安装anaconda的感想
  13. Java版二叉树的删除
  14. @Primary 和 @Qualifier的区别
  15. K8S(Kubernetes)
  16. OpenStack Mitaka Horizon 主题开发
  17. js 将微信二维码转为url,qrcodeJs解析二维码,qrcode.decode is not a function报错
  18. 轻量却超强——推荐几款好用的截图工具
  19. uniapp获取微信手机号码
  20. 孙辉老师《十年MFC经历认识的Microsoft技术》

热门文章

  1. 先使用皮尔逊相似性特征选择来训练随机森林
  2. torchvision.transforms 的CenterCrop():在图片的中间区域进行裁剪
  3. 使用Memory Analyzer tool(MAT)分析内存泄漏(一)
  4. Q:文件或目录的权限是什么意思?
  5. 2021 AI技术盘点:预训练模型5大进展
  6. 2020人工智能全球女性榜发布,致敬这些杰出的女科学家
  7. 这本 Kubernetes 图书,你一定不要错过!
  8. 新书上市 | 6岁的gRPC,终于出书了!
  9. 初级JavaScript程序员的绝佳进阶书
  10. 大到31x31的超大卷积核,涨点又高效,一作解读RepLKNet