知识蒸馏与迁移学习不仅仅属于模型优化的重要技术之一,也是提升模型跨领域泛化能力的重要技术,那么当前有哪些可用的知识蒸馏和迁移学习开源工具呢?

作者&编辑 | 言有三

1 PaddleSlim

PaddleSlim是百度提出的模型优化工具,包含在PaddlePaddle框架中,支持若干知识蒸馏算法,可以在teacher网络和student网络任意层添加组合loss,包括FSP loss,L2 loss,softmax with cross-entropy loss等。

https://github.com/PaddlePaddle/models/tree/develop/PaddleSlim

2 Distiller

Distiller是Intel基于Pytorch开源的模型优化工具,支持Hinton等人提出的Knowledge distillation算法。

https://github.com/NervanaSystems/distiller

3 MxNet

MxNet中集成了Bayesian Dark Knowledge方法的复现,在推荐系统中有一定作用。

https://github.com/apache/incubator-mxnet/tree/master/example/bayesian-methods

4 非官方Pytorch项目

Knowledge-Distillation-Zoo是GitHub用户AberHu蒸馏的知识蒸馏项目,支持fitnet等多个模型。

https://github.com/AberHu/Knowledge-Distillation-Zoo

deep-transfer-learning是GitHub用户easezyc整理的迁移学习项目。

https://github.com/easezyc/deep-transfer-learning

5 一些经典模型实现

Hinton等人在2015年提出了经典的知识蒸馏框架Knowledge distillation,下面是各大框架的复现。

[1] Keras

https://github.com/TropComplique/knowledge-distillation-keras

[2] Tensorflow
https://github.com/DushyantaDhyani/kdtf

[3] Caffe

https://github.com/wentianli/knowledge_distillation_caffe

更多的一些经典算法如下,留待读者自己学习,咱们就不沉迷于收藏了。

[1] Relational Knowledge Distillation算法

https://github.com/lenscloth/RKD

[2] Teacher-Assistant-Knowledge-Distillation算法

https://github.com/imirzadeh/Teacher-Assistant-Knowledge-Distillation

[3] Contrastive Representation Distillation算法

https://github.com/HobbitLong/RepDistiller

[4] Zero-shot_Knowledge_Distillation算法

https://github.com/sseung0703/Zero-shot_Knowledge_Distillation

[5] net2net算法

https://github.com/soumith/net2net.torch

[6] fitnet算法

https://github.com/adri-romsor/FitNets

6 开源综述资料

接下来再给大家介绍两个综述性质的开源资料。

第一个是知识蒸馏综述项目,包括相关的论文合集,也包括一些开源算法的实现。

https://github.com/dkozlov/awesome-knowledge-distillation

第二个是迁移学习综述项目,包括相关的论文合集,开源代码。

https://github.com/jindongwang/transferlearning

其他类似的还有https://github.com/artix41/awesome-transfer-learning,https://github.com/AI-ON/Multitask-and-Transfer-Learning,资料收集爱好者不妨关注。

7 更多理论学习

如果想要系统性学习模型优化相关的理论,可以移步有三AI知识星球 -> 网络结构1000变 -> 模型压缩板块 -> 模型剪枝,量化与蒸馏板块,知识蒸馏与迁移学习的一些解读案例如下:

总结

知识蒸馏与迁移学习相比于大量数据进行监督学习的方式,更符合人类学习的特点,在工业界有着实际落地需求,学术界有很重要的研究意义。

知识星球推荐

有三AI知识星球由言有三维护,内设AI知识汇总,AI书籍,网络结构,看图猜技术,数据集,项目开发,Github推荐,AI1000问八大学习板块。

【杂谈】为什么邀请大家加入硬核知识星球有三AI

转载文章请后台联系

侵权必究

往期精选

  • 【AutoML】如何选择最合适的数据增强操作

  • 【AutoML】激活函数如何进行自动学习和配置

  • 【AutoML】归一化(Normalization)方法如何进行自动学习和配置

  • 【AutoML】优化方法可以进行自动搜索学习吗?

  • 【AutoML】损失函数也可以进行自动搜索学习吗?

  • 【AutoML】如何使用强化学习进行模型剪枝?

  • 【AutoML】强化学习如何用于模型量化?

  • 【知识星球】分组卷积最新进展,全自动学习的分组有哪些经典模型?

  • 【知识星球】卷积核和感受野可动态分配的分组卷积

  • 【知识星球】有三AI 10月新主题,千奇百怪GAN上线!

  • 【知识星球】剪枝量化初完结,蒸馏学习又上线

  • 【知识星球】有没有网络模型是动态变化的,每次用的时候都不一样

  • 【杂谈】当前模型量化有哪些可用的开源工具?

  • 【杂谈】有三AI知识星球最近都GAN了哪些内容?

  • 【杂谈】当前模型剪枝有哪些可用的开源工具?

【杂谈】当前知识蒸馏与迁移学习有哪些可用的开源工具?相关推荐

  1. 杂谈 | 当前知识蒸馏与迁移学习有哪些可用的开源工具?

    所有参与投票的 CSDN 用户都参加抽奖活动 群内公布奖项,还有更多福利赠送 作者&编辑 | 言有三 来源 | 有三AI(ID:yanyousan_ai) [导读]知识蒸馏与迁移学习不仅仅属于 ...

  2. 【论文翻译_无数据知识蒸馏_元学习_2022】Up to 100× Faster Data-free Knowledge Distillation

    可以参考2021的另一篇解决相似问题的文章(Learning_Student_Networks_in_the_Wild) 摘要 data-free知识蒸馏(DFKD)由于其仅使用人造合成数据压缩模型的 ...

  3. 【杂谈】当前模型量化有哪些可用的开源工具?

    模型量化属于模型优化中的重要技术之一,是非常有效地提升模型推理速度的技术方案,那么当前有哪些可用的模型量化工具呢? 作者&编辑 | 言有三 1 Tensorflow Lite TensorFl ...

  4. 知识分享:值得学习的C语言经典开源项目

    点击上方蓝字关注我,了解节气咨询 听上去有些荒谬,C语言的产生竟然源于一个失败的项目.1969年,通用电气.麻省理工学院和贝尔实验室联合创立了一个庞大的项目--Multics工程.该项目的目的是创建一 ...

  5. 【杂谈】当前模型剪枝有哪些可用的开源工具?

    模型剪枝属于模型优化中的重要技术之一,经过了研究人员多年的研究,工业界也开始有一些实践,那么当前有哪些可用的模型剪枝工具呢? 作者&编辑 | 言有三 1 Tensorflow TensorFl ...

  6. 【深度学习】深度学习中的知识蒸馏技术(上)简介

    本文概览: 1. 知识蒸馏介绍 1.1 什么是知识蒸馏? 在化学中,蒸馏是一种有效的分离不同沸点组分的方法,大致步骤是先升温使低沸点的组分汽化,然后降温冷凝,达到分离出目标物质的目的.化学蒸馏条件:( ...

  7. [深度学习]知识蒸馏技术

    一 知识蒸馏(Knowledge Distillation)介绍 名词解释 teacher - 原始模型或模型ensemble student - 新模型 transfer set - 用来迁移tea ...

  8. 【深度学习之模型优化】模型剪枝、模型量化、知识蒸馏概述

    前言 模型部署优化这个方向其实比较宽泛.从模型完成训练,到最终将模型部署到实际硬件上,整个流程中会涉及到很多不同层面的工作,每一个环节对技术点的要求也不尽相同.但本质的工作无疑是通过减小模型大小,提高 ...

  9. 深度学习中的知识蒸馏技术(上)

    本文概览: 1. 知识蒸馏介绍 1.1 什么是知识蒸馏? 在化学中,蒸馏是一种有效的分离不同沸点组分的方法,大致步骤是先升温使低沸点的组分汽化,然后降温冷凝,达到分离出目标物质的目的.化学蒸馏条件:( ...

最新文章

  1. Android 依赖库发布(上传 Library 到 JCenter)gradle最高支持4.4
  2. java byte char io流_吃透Java IO:字节流、字符流、缓冲流
  3. Python机器学习:评价分类结果005precisoion-Recall的平衡
  4. B站视频下载器推荐(简单又好用)
  5. Centos Siege测试使用
  6. 【老罗笔记】关于成就的那些事
  7. 完美解决Excel复制后粘贴空白的问题
  8. 司铭宇讲师为平安人寿保险300位管理层培训《新生代员工的管理与激励》企业内训
  9. H. Zebras and Ocelots -ICPC North Central NA Contest 2017
  10. 【nginx】405 not allowed问题解决方法
  11. 美赛 LaTex排版笔记
  12. 【android】 如何把gif图片下载到本地
  13. c语言定时器实验程序,C语言定时器实验.doc
  14. html 引入网页title的图标,生成 .ico 图标
  15. AI大语音(八)——GMM-HMM声学模型(深度解析)
  16. mysql y m d h i_php时间问题?mysql数据库的时间格式(Y-M-D H:I:S) 在PHP页面想这样显示(Y-M-D) (apos;.#36;rows[apos;ndate...
  17. 网络安全:包过滤防火墙和代理防火墙(应用网关防火墙)
  18. GridView相关
  19. 白月黑羽教python_其他 | 白月黑羽教Python
  20. ROS基础教程-官网翻译版

热门文章

  1. 从 volatile 说到 i++ 的线程安全问题
  2. “面试不败计划”: java语言基础面试题(一)
  3. 哲学家就餐与死锁问题,死锁产生的条件以及解决方案
  4. python有多少关键字_Python挖词脚本,挖出几十万关键词不是梦带搜索量
  5. Python代码优化及技巧笔记(一)
  6. 使用SAX解析XML文件
  7. Oracle 的两种工作模式Dedicated Server 和 Shared Server
  8. Gentoo 安装日记 14 (配置内核 :设备驱动)
  9. android恶意代码检测报告,用机器学习检测Android恶意代码
  10. Maven的安装与Eclipse的配置