前言

随着迁移模型的概念流行起来,就像快乐会传染样,自然语言处理,计算机视觉,生成模型,强化学习,非监监督学习,语音识别 这几个领域内部产生了大量的可复用可迁移学习的基础模型,领域之间的方法也在互相学习传递。模型动物园的概念应运而生。后文找到一些相对比较大的模型动物园。

PaddleHub

介绍:

PaddlePaddle 提供了丰富的计算单元,使得用户可以采用模块化的方法解决各种学习问题。在此Repo中,我们展示了如何用 PaddlePaddle来解决常见的机器学习任务,提供若干种不同的易学易用的神经网络模型。便捷地获取PaddlePaddle生态下的预训练模型,完成模型的管理和一键预测。配合使用Fine-tune API,可以基于大规模预训练模型快速完成迁移学习,让预训练模型能更好地服务于用户特定场景的应用。

  • 无需数据和训练,一键模型应用
  • 一键模型转服务
  • 易用的迁移学习
  • 丰富的预训练模型
!pip install --upgrade paddlepaddle -i https://mirror.baidu.com/pypi/simple
!pip install --upgrade paddlehub -i https://mirror.baidu.com/pypi/simpleimport paddlehub as hublac = hub.Module(name="lac")
test_text = ["今天是个好天气。"]results = lac.cut(text=test_text, use_gpu=False, batch_size=1, return_tag=True)
print(results)
#{'word': ['今天', '是', '个', '好天气', '。'], 'tag': ['TIME', 'v', 'q', 'n', 'w']}

从目录可以看出来国人可以用百度开源的hub里的模型分分钟做些应用出来,涵盖的范围比较全面,适合国人,相信不久会成为主流,例如:

使用Paddlehub完成伪3D特效

地址:

https://github.com/PaddlePaddle/models

https://github.com/PaddlePaddle/PaddleHub

TensorFlow Hub & TensorFlow Models

介绍:

官方介绍,TensorFlow Hub是一个库,用于发布、发现和使用机器学习模型中可重复利用的部分。 模块是一个独立的 TensorFlow 图部分,其中包含权重和资源,可以在一个进程中供不同任务重复使用(称为迁移学习)。 从而实现使用较小的数据集训练模型;改善泛化效果,以及加快训练速度。 目前,TensorFlow Hub一共有20个API、75个用于文本嵌入的模块、71个用于图像特征向量模块,以及2个用于视频分类的模块等等。TensorFlow Hub 是一个包含经过训练的机器学习模型的代码库,这些模型稍作调整便可部署到任何设备上。您只需几行代码即可重复使用经过训练的模型,例如 BERT 和 Faster R-CNN。TensorFlow Hub是使用TensorFlow进行机器学习的可重用资产库。特别是,它提供了预先训练保存的模型,可以重用这些模型来解决新任务,而训练时间和训练数据更少。这个GitHub存储库托管了tensorflow_hub Python库,可以用最少的代码下载和重用TensorFlow程序中保存的模型,以及其他相关的代码和文档。模块基本上全来自谷歌官方,来自谷歌AI的有大多数,还有一些来自DeepMind。TensorFlow Hub支持使用语言、网络、提供者、数据集以及类型来对模块进行精确筛查。其中有8个模块支持中文。

一个GitHub上的存储库,包含了许多在TensorFlow中实现的模型,一共分为两类:官方模型和研究模型。官方模型,是使用TensorFlow的高级API的示例模型的集合。它们能够得到良好的维护、测试,并与最新的稳定的TensorFlow API保持同步。项目创建者表示,推荐新的TensorFlow用户从这里开始,目前可用的模型有:BERT、Boosted Trees、MNIST、ResNet、Transformer、Wide_deep研究模型,是研究人员在TensorFlow中实现的大量模型集合。它们在发布分支中不受官方支持或不可用;模型维护等方面取决于各个研究人员。目前有51个模型,覆盖计算机视觉、自然语言处理领域等等。

  !pip install --upgrade tensorflow_hubimport tensorflow_hub as hubmodel = hub.KerasLayer("https://tfhub.dev/google/nnlm-en-dim128/2")embeddings = model(["The rain in Spain.", "falls","mainly", "In the plain!"])print(embeddings.shape)  #(4,128)

标题

主要汇集了是个大方便的模型,包含:使用tf2.0 实现的一些SOTA等

地址:

https://www.tensorflow.org/hub

https://github.com/tensorflow/models

PyTorch Hub

这个Facebook的深度学习模型库,一问世就引发了巨大关注。因为它太强了:ResNet、BERT、GPT、VGG、PGAN、MobileNet等深度学习领域的经典模型,只需输入一行代码,就能一键调用。在这些地方,深度学习模型同样能够“拿来就能用”。

官方介绍,PyTorch Hub是一个简易API和工作流程,为复现研究提供了基本构建模块,包含预训练模型库。

PyTorch Hub支持Colab,能与论文代码结合网站Papers With Code集成,用于更广泛的研究。

此外,Facebook还鼓励学者把自己的模型发布到这里来,来让PyTorch Hub越来越强大。

目前,PyTorch Hub有26个模型可以使用,它们分别是:Deeplabv3-ResNet101、Transformer (NMT)、WaveGlow、ResNext WSL、DCGAN on FashionGen、Progressive Growing of GANs (PGAN)、BERT、GPT、GPT-2、Transformer-XL、U-Net for brain MRI、SSD、Tacotron 2、RoBERTa、AlexNet、Densenet、FCN-ResNet101、GoogLeNet、Inception_v3、MobileNet v2、ResNet、ResNext、ShuffleNet v2、SqueezeNet、vgg-nets、Wide ResNet

我们接受提交到PyTorch hub通过PR在hub repo。一旦这里的PR合并为master,它会在24小时内出现在PyTorch网站上。

主要包含语音,生成模型,自然语言处理,视觉,脚本化等5个方向的模型。

model = torch.hub.load('pytorch/vision', 'resnet18', pretrained=True)

地址:

https://pytorch.org/hub/

https://github.com/pytorch/hub

Model Zoo

这个平台,由新加坡名为Jing Yu Koh本科生牵头搭建。与上述的几个平台不同,这个平台上提供预训练模型,不仅仅只是完全针对于Pytorch或者TensorFlow。 在每个模型上,会标注出这个模型在GitHub的标星数量,模型适用的框架、领域以及模型的使用条件/用途。 目前已经收集了数百个模型,覆盖的领域包括计算机视觉、自然语言处理、强化学习、无监督学习、音频和语音、生成模型。 涉及到的框架有:TensorFlow、Caffe、Caffe2、PyTorch、MXNet、Keras、Chainer。这个模型动物园可以理解为一个元搜索引擎的概念,囊括了各个机器学习框架的模型。

包含主流的7个深度学习框架。

涵盖深度学习涉足的6个主流领域。

地址:

https://modelzoo.co/

Models – IBM Developer

Models – IBM Developer

IBM开放的预训练深度模型库,目前一共有32个模型,分为可部署和可训练模型两类,涉及18个领域,分别是:

声音分类、音频特征提取、音频建模、面部识别、图像分类、图像特征提取、图像到图像的翻译或转换、图像到文本的翻译、语言建模、命名实体识别、自然语言处理、图片中的目标检测、安全、文本分类、文本特征提取、文本到图像的翻译、时间序列预测、视频分类

标题

带有30个模型。https://developer.ibm.com/exchanges/models/all/max-speech-to-text-converter/ 基本上都有放到docker:

地址:

https://developer.ibm.com/exchanges/models/all/

OpenCLaP

介绍:OpenCLaP(Open Chinese Language Pre-trained Model Zoo)是由清华大学人工智能研究院自然语言处理与社会人文计算研究中心推出的一个多领域中文预训练模型仓库。预训练语言模型通过在大规模文本上进行预训练,可以作为下游自然语言处理任务的模型参数或者模型输入以提高模型的整体性能。该模型仓库具有如下几个特点:

  • 多领域。我们目前训练出了基于法律文本和百度百科的预训练模型,以提供多样化的可选择模型。
  • 能力强。我们使用了当前主流的 BERT 模型作为预训练的神经网络结构,并支持最大 512 长度的文本输入来适配更加多样的任务需求。
  • 持续更新。我们将在近期加入更多的预训练模型,如增加更多样的训练语料,使用最新的全词覆盖(Whole Word Masking)训练策略等。
    可以看出主要是中文语料的一个预训练模型

地址:

https://github.com/thunlp/OpenCLaP

OpenVINO™ Toolkit Intel's Pre-Trained Models

介绍:

OpenVINO™工具包概述

OpenVINO™工具包提供了一组预先训练过的模型,您可以使用它们进行学习和演示,或者开发深度学习软件。最新版本可在Github上的回购。

模型可以通过模型下载器下载(<OPENVINO_INSTALL_DIR>/deployment_tools/open_model_zoo/tools/ Downloader)。它们也可以从01.org手动下载。

涵盖图像,自然语言处理等15类模型。

地址:

https://github.com/openvinotoolkit/open_model_zoo/blob/master/models/intel/index.md

ONNX Model Zoo

介绍:

开放神经网络交换(Open Neural Network Exchange, ONNX)是一种表示机器学习模型的开放标准格式。ONNX得到了一个合作伙伴社区的支持,他们已经在许多框架和工具中实现了ONNX。

ONNX模型动物园是由像您这样的社区成员以ONNX格式提供的一组预先训练的、最先进的模型。每个模型都配有木星笔记本,用于模型训练和运行推理与训练的模型。这些笔记本是用Python编写的,包括到训练数据集的链接,以及描述模型架构的原始论文的参考文献。

我们已经标准化了Git LFS(大文件存储)来存储ONNX模型文件。要下载ONNX模型,请导航到相应的Github页面,并单击右上角的下载按钮。

如图可以看到其支持机器视觉,自然语言处理,语音识别等模型,有好几十个模型。

地址:

https://github.com/onnx/models

Caffe2 Model

介绍:

这是一个存储预先训练好的caffe2模型的存储库。您可以使用caffe2来帮助您下载或在您的机器上安装这些模型。Caffe有许多分类的预训练模型及网络结构,我自己训练过的模型总结在Github上,基本上涵盖了大部分的分类模型,包括AlexNet,VGG,GoogLeNet,Inception系列,ResNet,SENet,DenseNet,SqueezeNet。 其中会碰到不少坑,例如VGG给的结构已经太旧了,需要根据新版本Caffe的进行修改,DenseNet训练有些地方需要修改等。鉴于以上原因,我自己整理了一个Caffe Model Zoo,都是已经使用Caffe训练过模型的。 作者:SnailTyan 链接:https://www.jianshu.com/p/6d357d78e951 来源:简书 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

模型比较老旧了,不多,主要是图像处理的模型

地址:

https://github.com/facebookarchive/models

https://github.com/SnailTyan/caffe-model-zoo

https://github.com/BVLC/caffe/wiki/Model-Zoo

openmmlab

介绍:

学术研究和工业应用的开源项目。OpenMMLab涵盖了广泛的计算机视觉研究主题,如分类、检测、分割和超分辨率。

含有很多机器视觉的model,是个不错的学习对象

地址:

https://openmmlab.com/

https://github.com/open-mmlab

https://github.com/open-mmlab/mmdetection

总结

最后,总结一下。

上文提到的这些深度模型库中,有一些是专用的,比如PaddleHub、PyTorch Hub、TensorFlow Hub和TensorFlow Models,只能够在PaddlePaddle,PyTorch框架或者TensorFlow中使用,但其使用起来非常方便,能够快速调用部署。

其他的,比如Model Zoo,Caffe2 Model、ONNX Model Zoo、OpenCLaP、OpenVINO则是由个人开发者、开源社区、学校组织收集,覆盖面很广泛,模型也很多,但相对来说,部署起来并没有直接利用PaddleHub、PyTorch Hub或TensorFlow Hub方便。

大家可以根据自己的需求选择相应深度学习库。工作,学习,参加比赛利用好了,可以事半功倍。

可以看出百度最近股价创三年前新高,目前百度aistudio(https://aistudio.baidu.com/aistudio/index)平台上出现大量的免费课程和各种比赛活动,随着基于逐步出现一些基于百度的PaddlePaddle机器学习框架的应用出现,逐步会成为国内一个主流机器学习框架。

量化交易有因子动物园 深度学习里有模型动物园(ModelZoo)又叫模型市场基于深度学习的增量学习,迁移学习等技术发展而来【调研】相关推荐

  1. 基于PaddleGAN项目人脸表情动作迁移学习(五)图像补帧上色与超分修复

    学习目标 体验基于PaddleGAN的图像上色.补针.超分等功能,涉及模型包括DAIN.DeOldify.RealSR.DeepRemaster.EDVR.PPMSVSR等. 一.算法原理 1.补帧模 ...

  2. 半监督分类算法_基于同质区和迁移学习的高光谱图像半监督分类

    作 者 信 息 赵婵娟,周绍光,丁 倩,刘丽丽 (河海大学 地球科学与工程学院,江苏 南京 211100) " [摘要]针对高光谱遥感图像分类中标记样本难获取的问题,提出了一种基于同质区和迁 ...

  3. NAACL| 基于标签感知的双迁移学习在医学命名实体识别中的应用

    本期给大家介绍上海交通大学APEX数据和知识管理实验室俞勇教授课题组发表在NAACL的文章"Label-aware Double Transfer Learning for Cross-Sp ...

  4. 基于Keras Application和Densenet迁移学习(transfer learning)的乳腺癌图像分类模型(良性、恶性)

    基于Keras Application和Densenet迁移学习(transfer learning)的乳腺癌图像分类模型(良性.恶性) 概论: 美国癌症学会官方期刊发表<2018年全球癌症统计 ...

  5. 基于PaddleGAN项目人脸表情动作迁移学习(四)人脸动漫化

    学习目标: 体验基于PaddleGAN的真实人脸实现动漫化,相关模型:AnimeGANv2. AnimeGANv2原理: 人脸动漫化(Photo to Cartoon)是指将真实人脸转化成动漫风格,在 ...

  6. 基于PaddleGAN项目人脸表情动作迁移学习(三)人脸融合

    学习目标: 体验基于PaddleGAN的图像生成模型实现的人脸融合,模型名称:StyleGAN V2 StyleGAN V2 原理: StyleGAN V2 的任务是image generation, ...

  7. #今日论文推荐#NAACL 2022 | 基于Prompt的文本生成迁移学习

    #今日论文推荐#NAACL 2022 | 基于Prompt的文本生成迁移学习 预训练语言模型(PLM)通过微调在文本生成任务方面取得了显著进展.然而,在数据稀缺的情况下,微调 PLMs 是一项挑战.因 ...

  8. 基于深度学习模型的花卉图像分类代码_实战 | 基于深度学习模型VGG的图像识别(附代码)...

    本文演示了如何使用百度公司的PaddlePaddle实现基于深度学习模型VGG的图像识别. 准备工作 VGG简介 牛津大学VGG(Visual Geometry Group)组在2014年ILSVRC ...

  9. 图模型+Bert香不香?完全基于注意力机制的图表征学习模型Graph-Bert

    作者 | Jiawei Zhang.Haopeng Zhang.Congying Xia.Li Sun 译者 | 凯隐 编辑 | Jane 出品 | AI科技大本营(ID:rgznai100) [导读 ...

最新文章

  1. B S架构 服务器虚拟化,B/S 架构及 Tomcat
  2. mysql引擎层存储层_MySQL存储底层技术:InnoDB底层原理解读
  3. python小课文件_[Python]小甲鱼Python视频第028课(文件:因为懂你,所以永恒)课后题及参考解8...
  4. dell主板40针开机针脚_电脑主板各种接口的介绍最新版
  5. linux切换任务命令,Linux top详解之交互命令、命令行选项
  6. Linux拓展通配符的使用
  7. CentOS 架设DHCP服务
  8. Python: 如何继承str/string?
  9. 这个TsuNAME 新漏洞可对关键 DNS 服务器发动 DDoS 攻击
  10. [book] iOS 8 Swift Programming Cookbook
  11. C语言读者管理系统——软件项目开发实践
  12. 开启Accessibility的快捷方式-3次home键或者侧边键
  13. excel不同文件表格批量加表头vba_用Excel VBA实现多文件夹内文件加入表头 遍历文件...
  14. 1116: 删除元素 C语言
  15. JAVA工程师最新面试题(来源于互联网)
  16. Unity中的进度条(内含计数器)
  17. Excel学习笔记:P13-页首、页尾设计、表格加水印
  18. 【Scapy】获取流量包【原创】
  19. java.sql.SQLException: sql injection violation, multi-statement not allow
  20. 工业机器人与计算机控制,不懂工业机器人控制技术?那你一定是没看过这篇文章...

热门文章

  1. 193页PPT读懂《数字化转型方法论》,强烈建议收藏!
  2. 【史上最强代码编辑器VS Code】之VS Code 在线听网易云音乐
  3. 有哪些好用的思维导图软件?
  4. www.050604.pw ub.php,BOL_050604_M_010
  5. 微信小程序 富文本组件使用
  6. 列表等份切割,Google Utils Lists partition
  7. 曾善美一女大学生的创业之路
  8. 独家 | 新手指南:大数据、区块链及其结合(附应用场景)
  9. win10浏览器正常访问,但无法进行下载(解决方法)
  10. diy 单片机 自动浇花_基于单片机的自动浇花器设计