1. Pre-tuning method

在现实世界里应用ML,得到大量精确标注的数据是昂贵的。

如果只有少量精确标注的数据,pre-tuning method可以帮助提升最后训练模型的精度[1]。

First pre-tuning on cheap large datasets on related domain.

Then fine-tuning on expensive well-labeled data.

As we fine-tune on precisely labeled data,

it is possible to pre-train on so-called weakly labeled data.

(i.e. 90% of the labels might be correct and 10% wrong)

2.Caveats of real-world label distributions[1]

在现实世界里,得到的数据有以下特征(相对于学术界里的平衡数据):

- Unbalanced label distribution

- Unbalanced cost of misclassification

Solution[1],让训练集里的数据数量上更平衡:
- More data
- Change labeling:ie. merge some rare labels
- Sampling: ignore / over-or undersample / Negative minging / weighting the loss

3. Understanding black box models
在现实世界里应用ML,你不仅需要提高准确率,还需要考虑以下问题:
- understand why and how a model can make wrong predictions,
- give some intuition why our model can perform better than any previous solution,

- make sure that the model cannot be tricked.

参考:

[1] 《Applying deep learning to real-world problems》

https://medium.com/merantix/applying-deep-learning-to-real-world-problems-ba2d86ac5837

Machine Learning 务实----Applying deep learning to real-world problems相关推荐

  1. 机器学习(Machine Learning)深度学习(Deep Learning)资料(Chapter 2)

    机器学习(Machine Learning)&深度学习(Deep Learning)资料(Chapter 2) - tony的专栏 - 博客频道 - CSDN.NET 注:机器学习资料篇目一共 ...

  2. 机器学习(Machine Learning)深度学习(Deep Learning)资料汇总

    本文来源:https://github.com/ty4z2008/Qix/blob/master/dl.md 机器学习(Machine Learning)&深度学习(Deep Learning ...

  3. 读Applying Deep Learning To Airbnb Search有感

    读Applying Deep Learning To Airbnb Search有感 介绍 Airbnb的房屋预订系统对于房主和租客来说是一个双向的平台,房主想出租他们的空间,租客想预订房间.airb ...

  4. 机器学习(Machine Learning)深度学习(Deep Learning)资料【转】

    转自:机器学习(Machine Learning)&深度学习(Deep Learning)资料 <Brief History of Machine Learning> 介绍:这是一 ...

  5. 机器学习(Machine Learning)深度学习(Deep Learning)资料集合

    机器学习(Machine Learning)&深度学习(Deep Learning)资料 原文链接:https://github.com/ty4z2008/Qix/blob/master/dl ...

  6. 机器学习 Machine Learning 深度学习 Deep Learning 资料

    机器学习(Machine Learning)&深度学习(Deep Learning)资料 機器學習.深度學習方面不錯的資料,轉載. 原作:https://github.com/ty4z2008 ...

  7. (转)机器学习(Machine Learning)深度学习(Deep Learning)资料

    原文链接:https://github.com/ty4z2008/Qix/blob/master/dl.md 机器学习(Machine Learning)&深度学习(Deep Learning ...

  8. 多GPU运行Deep Learning 和 并行Deep Learning(待续)

    本文论述了 Deep learning运行所需的硬件配置,多GPU运行Deep Learning,设置Deep Learning的数据并行和 模型并行.详情请参考下文 http://timdettme ...

  9. 《Ensemble Learning Methods for Deep Learning Neural Networks》笔记

    文章连接:Ensemble Learning Methods for Deep Learning Neural Networks 前言 神经网络提供了更大的灵活性,并可根据可用的培训数据量进行调整.但 ...

最新文章

  1. OCP-052 053部分答案解析
  2. java实现注销登录
  3. Linux用户组笔记整理
  4. 现在是2016-09-23,查询2个月后的月份和入职的月份相同的数据
  5. 软件生成问候图片_这些社交软件你玩过几个?
  6. 上下文管理、redis发布订阅、RabbitMQ发布订阅、SQLAlchemy
  7. 课程设计:大学生信息管理系统
  8. 重写GridView支持数据筛选和自动排序功能
  9. Java入门学习笔记之变量与计算
  10. 建立mysql服务器连接失败_解决项目启动无法创建到数据库服务器的连接错误
  11. UCI数据集汇总及描述
  12. SpringBoot——springboot SPI原理与实战
  13. React中防止事件冒泡:e.stopPropagation()
  14. 从“富客户端”(RIA)说到 Flex AIR
  15. 痞子衡嵌入式:深扒i.MXRTxxx系列ROM中集成的串行NOR Flash启动SW Reset功能及其应用场合...
  16. 模拟器和平精英连接服务器没有响应,和平精英模拟器卡顿解决方法一览
  17. 启明欣欣STM32开发板移植FreeRTOS
  18. 上班没事做gai这么办
  19. IT 领导力:真正数字化领导者的 5 大特质
  20. Angular防抖设计——点击事件

热门文章

  1. 数据结构 data structure
  2. Linux系统-小倒腾之Linux DIY定制裁剪(New kernel+Busybox)o_o(二)
  3. 64位Win8企业版出现“Unknown Hard Error”系统警告的一个解决方法
  4. Mapbar 地图 API 概念   技术文档
  5. Introduction to Oracle9i: SQL------- left join 和 left outer join 的区别
  6. 为何要使用大数据可视化平台
  7. android程序安装空间不足,AndroidStudio提示磁盘空间不足
  8. services.xml应该放在项目的哪里_新轮胎应该放在前轮还是后轮?
  9. mysql对应systables_mysql5.7中的sys表详解(转)
  10. enum ordinal java_Java中怎样由枚举常量的ordinal值获得枚举常量对象