点上方蓝字计算机视觉联盟获取更多干货

在右上方 ··· 设为星标 ★,与你不见不散

仅作学术分享,不代表本公众号立场,侵权联系删除

转载于:作者丨时晴

来源丨炼丹笔记

AI博士笔记系列推荐

周志华《机器学习》手推笔记正式开源!可打印版本附pdf下载链接

Focal Loss

针对类别不平衡问题,用预测概率对不同类别的loss进行加权。Focal loss对CE loss增加了一个调制系数来降低容易样本的权重值,使得训练过程更加关注困难样本。

loss = -np.log(p) loss = (1-p)^G * loss

Dropout

随机丢弃,抑制过拟合,提高模型鲁棒性。

Normalization

Batch Normalization 于2015年由 Google 提出,开 Normalization 之先河。其规范化针对单个神经元进行,利用网络训练时一个 mini-batch 的数据来计算该神经元的均值和方差,因而称为 Batch Normalization。

x = (x - x.mean()) / x.std()

relu

用极简的方式实现非线性激活,缓解梯度消失。

x = max(x, 0)

Cyclic LR

每隔一段时间重启学习率,这样在单位时间内能收敛到多个局部最小值,可以得到很多个模型做集成。

scheduler = lambda x: ((LR_INIT-LR_MIN)/2)*(np.cos(PI*(np.mod(x-1,CYCLE)/(CYCLE)))+1)+LR_MIN

With Flooding

当training loss大于一个阈值时,进行正常的梯度下降;当training loss低于阈值时,会反过来进行梯度上升,让training loss保持在一个阈值附近,让模型持续进行“random walk”,并期望模型能被优化到一个平坦的损失区域,这样发现test loss进行了double decent。

flood = (loss - b).abs() + b

Group Normalization

Face book AI research(FAIR)吴育昕-恺明联合推出重磅新作Group Normalization(GN),提出使用Group Normalization 替代深度学习里程碑式的工作Batch normalization。一句话概括,Group Normbalization(GN)是一种新的深度学习归一化方式,可以替代BN。

def GroupNorm(x, gamma, beta, G, eps=1e-5):    # x: input features with shape [N,C,H,W]    # gamma, beta: scale and offset, with shape [1,C,1,1]    # G: number of groups for GN    N, C, H, W = x.shape    x = tf.reshape(x, [N, G, C // G, H, W])    mean, var = tf.nn.moments(x, [2, 3, 4], keep dims=True)    x = (x - mean) / tf.sqrt(var + eps)    x = tf.reshape(x, [N, C, H, W])    return x * gamma + beta

Label Smoothing

abel smoothing将hard label转变成soft label,使网络优化更加平滑。标签平滑是用于深度神经网络(DNN)的有效正则化工具,该工具通过在均匀分布和hard标签之间应用加权平均值来生成soft标签。它通常用于减少训练DNN的过拟合问题并进一步提高分类性能。

targets = (1 - label_smooth) * targets + label_smooth / num_classes

Wasserstein GAN

  • 彻底解决GAN训练不稳定的问题,不再需要小心平衡生成器和判别器的训练程度

  • 基本解决了Collapse mode的问题,确保了生成样本的多样性

  • 训练过程中终于有一个像交叉熵、准确率这样的数值来指示训练的进程,数值越小代表GAN训练得越好,代表生成器产生的图像质量越高

  • 不需要精心设计的网络架构,最简单的多层全连接网络就可以做到以上3点。

Skip Connection

一种网络结构,提供恒等映射的能力,保证模型不会因网络变深而退化。

F(x) = F(x) + x

参考文献:

  • https://www.zhihu.com/question/427088601

  • https://arxiv.org/pdf/1701.07875.pdf

  • https://zhuanlan.zhihu.com/p/25071913

  • https://www.zhihu.com/people/yuconan/posts

end

我是王博Kings,一名985AI博士,在Github上开源了机器学习、深度学习等一系列手推笔记,获得了不少同学的支持。

这是我的私人微信,还有少量坑位,可与相关学者研究人员交流学习 

目前开设有人工智能、机器学习、计算机视觉、自动驾驶(含SLAM)、Python、求职面经、综合交流群扫描添加CV联盟微信拉你进群,备注:CV联盟

王博Kings 的公众号,欢迎关注,干货多多

王博Kings的系列手推笔记(附高清PDF下载):

博士笔记 | 周志华《机器学习》手推笔记第一章思维导图

博士笔记 | 周志华《机器学习》手推笔记第二章“模型评估与选择”

博士笔记 | 周志华《机器学习》手推笔记第三章“线性模型”

博士笔记 | 周志华《机器学习》手推笔记第四章“决策树”

博士笔记 | 周志华《机器学习》手推笔记第五章“神经网络”

博士笔记 | 周志华《机器学习》手推笔记第六章支持向量机(上)

博士笔记 | 周志华《机器学习》手推笔记第六章支持向量机(下)

博士笔记 | 周志华《机器学习》手推笔记第七章贝叶斯分类(上)

博士笔记 | 周志华《机器学习》手推笔记第七章贝叶斯分类(下)

博士笔记 | 周志华《机器学习》手推笔记第八章集成学习(上)

博士笔记 | 周志华《机器学习》手推笔记第八章集成学习(下)

博士笔记 | 周志华《机器学习》手推笔记第九章聚类

博士笔记 | 周志华《机器学习》手推笔记第十章降维与度量学习

博士笔记 | 周志华《机器学习》手推笔记第十一章特征选择与稀疏学习

博士笔记 | 周志华《机器学习》手推笔记第十二章计算学习理论(上)

博士笔记 | 周志华《机器学习》手推笔记第十二章计算学习理论(下)

博士笔记 | 周志华《机器学习》手推笔记第十三章半监督学习

博士笔记 | 周志华《机器学习》手推笔记第十四章概率图模型

点个在看支持一下吧

大道至简:算法工程师须知的十个炼丹trick相关推荐

  1. 算法工程师掌握了这个炼丹技巧的我开始突飞猛进

    文 | 夕小瑶 从不拖稿的小夕今天在知乎上刷到一个问题: 哈?一向求真务实.高逼格讨论的知乎画风怎么突然就不一样了. 我以为回答区会有这张图: ▲如来神掌 结果竟然没有!知乎果然没有让我失望,还是一如 ...

  2. 【大道至简】机器学习算法之隐马尔科夫模型(Hidden Markov Model, HMM)详解(3)---学习问题:Baum-Welch算法推导及Python代码实现

    ☕️ 本文系列文章汇总: (1)HMM开篇:基本概念和几个要素 (2)HMM计算问题:前后向算法 (3)HMM学习问题:Baum-Welch算法 (4) HMM预测问题:维特比算法 ☕️ 本文来自专栏 ...

  3. 【大道至简】机器学习算法之EM算法(Expectation Maximization Algorithm)详解(附代码)---通俗理解EM算法。

    ☕️ 本文来自专栏:大道至简之机器学习系列专栏

  4. 大道至简:大数据、小数据、量化交易

    大道至简:大数据.小数据.量化交易, 11.23 今天下午在Q群:124134140(zwPython大数据量化交易). 与大家讨论大数据.量化交易, 没想到,晚上就碰到了一只黑天鹅 惯例,QQ讨论直 ...

  5. 【机器学习基础】算法工程师必备的机器学习--EM

    『运筹OR帷幄』原创 作者:华校专 作者信息: 华校专,曾任阿里巴巴资深算法工程师.智易科技首席算法研究员,现任腾讯高级研究员,<Python 大战机器学习>的作者. 编者按: 算法工程师 ...

  6. 大道至简(第六章)读后感

    大道至简(第六章)读后感 还是不乐意去读,但总算可以耐心的读下去了,这也许也算是读大道至简以来的收获之一吧.第六章的题目是从编程到工程,看到工程二字,让我不由想起了前几天和高中同学聊天.他报的燕大土木 ...

  7. 大道至简读后感(七八章)

    大道至简读后感 --终章 到了第九周,我们的JAVA课程的学习也接近了尾声,但是我们在课上所学到只是最为简单的基础.就像老师所说的那样,我们还是要到一些java课程的公开课上去学习.最后,对于大道至简 ...

  8. 大道至简:软件工程实践者的思想(典藏版)

    周爱民 著 ISBN 978-7-121-17790-3 2012 年8 月出版 定价:49.00 元 16开 228页 内 容 简 介 本书提出了审视软件工程的全新视角和软件工程的体系模型(EHM, ...

  9. 咳咳,软工新手读《大道至简》读后感

    <大道至简>读后感 本书是周爱民先生把这本<大道至简>表达为"阐述软件工程的思想核心",书中又分为八个章节,接下来我想把我对每个章节的认识分开来介绍. 在第 ...

最新文章

  1. Python机器学习——DBSCAN聚类
  2. 分享Kali Linux 2016.2最新镜像20160919
  3. C++中map的使用
  4. iis express8 自动关闭
  5. lua实现stack(lua程序设计21.7 练习21.1题)
  6. 徽柏工业机器人_新松机器人股票(中国机器人公司排名是怎样的?)
  7. Coding the Matrix Week 1 The vector 作业
  8. Segment Tree Beats 区间最值问题
  9. 数据科学入门与实战:玩转pandas之二
  10. PSD分层模板素材|电商页面这样设计,转化率成倍提高!
  11. 随想录(协议栈的基本技术)
  12. java json data_java中json数据格式的处理
  13. mysql join 组合索引,图文详解MySQL中两表关联的连接表如何创建索引
  14. 卡尔曼滤波(Kalman filtering)算法学习小记
  15. 数据库系统基础教程(原书第三版)课后答案汇总
  16. webstorm主题
  17. 图解机器学习:分类模型性能评估指标
  18. android 2.3.6Gallary源码导入到Eclipse中编译
  19. 计算机在运行表格的时候很慢,打开excel很慢_EXCEL表格打开反应太慢时什么原因...
  20. 旋转框目标检测mmrotate v0.3.1入门

热门文章

  1. 仿个人税务 app html5_个税App上线,也得注重用户体验 | 光明网评论员
  2. html个人主页_前端性能优化实践 之 百度App个人主页优化
  3. unixODBC配置文件
  4. java se 1335,1335.逼退法王
  5. linux拷贝文件1003无标题,2.27Linux和windows互传;3.1用户配置文件和密码配置文件;3.2/3.3用户组用户...
  6. seo代码优化工具_企业seo该怎么优化
  7. Android studio3.5 SDK29项目开发笔记
  8. 计算机编程ebcdic码,EBCDIC 与 ASCII 编码相互转换
  9. 打印工资条怎么做到每个人都有表头明细_一分钟生成500人的工资条?还有2种方法?...
  10. extjs html页面刷新,ExtJS onReady引发的浏览器对页面的加载过程