加入预训练模型,若是报类似以下的错误:

 Unexpected key(s) in state_dict: "layer1.0.weight", "layer1.0.bias", "layer1.1.weight", "layer1.1.bias", "layer1.1._var", "layer2.0.weight", "layer2.0.bias", "layer2.1.weight", "layer2.1.bias", "layer2.1.running_mean", "layer2.1.running_v0.bias", "layer3.1.weight", "layer3.1.bias", "layer3.1.running_mean", "layer3.1.running_var", "layer4.0.weight", "layer4.0.4.1.bias", "layer4.1.running_mean", "layer4.1.running_var", "layer5.0.weight", "layer5.0.bias", "layer5.1.weight", "layer5., "layer5.1.running_var".

最直接的方法,放与代码网络匹配的预训练模型!!!
其他的比较好找,就不提供了。这里提供一个匹配Tularov Arbi复现的SiamRPN预训练模型,链接如下:
https://pan.baidu.com/s/1road7tNSIc65VRjtiDSTiw提取码:69nq

还是要推荐一下Tularov Arbi复现的SiamRPN代码。这个代码看着很舒服、很整洁。比较容易看懂。

下面解决的方法就比较复杂了!!!
出现上述错误,因为我们构建的网络模型和加入的预训练模型的key值不对应。说key值可能不太好理解。用下面例子简单说一下:
预训练模型构建的网络:

我们自己构建的网络:

如上所示,self.layer1就好比keys。 而我们的是self.featureExtractd,这两是没有办法对应上的。所以运行的时候就报出现意外的keys的错误。

我们按着预训练模型keys值的结构,重新构建我们的网络就可以了。还有一点这样重新构建可以解决上述问题。但是想运行通可能还需要改一些地方的代码,这就需要按着你的代码要求去修改了!

最后放一个查看模型key值的代码:

checkpoint = torch.load(config.pretrained_model, map_location='cpu')for k,v in checkpoint.items():print(k)print("hcc-wyq")

解决SiamRPN预训练模型的问题相关推荐

  1. 「NLP」ALBERT:更轻更快的NLP预训练模型

    目前在NLP领域,出彩的预训练模型的新工作,几乎都是基于BERT的改进,前面我们就介绍了XLNET.今天我来介绍一个更新的工作,相比于BERT,它更轻量,效果也要好. 作者 | 小Dream哥 编辑 ...

  2. 【NLP】ALBERT:更轻更快的NLP预训练模型

    目前在NLP领域,出彩的预训练模型的新工作,几乎都是基于BERT的改进,前面我们就介绍了XLNET.今天我来介绍一个更新的工作,相比于BERT,它更轻量,效果也要好. 作者&编辑 | 小Dre ...

  3. 《预训练周刊》第23期:Smart Bird:解决变换器性能瓶颈的新方法、Prompt:如何提升预训练模型的迁移效果...

    No.23 智源社区 预训练组 预 训 练 研究 观点 资源 活动 关于周刊 超大规模预训练模型是当前人工智能领域研究的热点,为了帮助研究与工程人员了解这一领域的进展和资讯,智源社区整理了第23期&l ...

  4. 智能文档理解:通用文档预训练模型

    预训练模型到底是什么,它是如何被应用在产品里,未来又有哪些机会和挑战? 预训练模型把迁移学习很好地用起来了,让我们感到眼前一亮.这和小孩子读书一样,一开始语文.数学.化学都学,读书.网上游戏等,在脑子 ...

  5. BERT的通俗理解 预训练模型 微调

    1.预训练模型       BERT是一个预训练的模型,那么什么是预训练呢?举例子进行简单的介绍       假设已有A训练集,先用A对网络进行预训练,在A任务上学会网络参数,然后保存以备后用,当来一 ...

  6. Paddle预训练模型应用工具PaddleHub

    Paddle预训练模型应用工具PaddleHub • 本文主要介绍如何使用飞桨预训练模型管理工具PaddleHub,快速体验模型以及实现迁移学习.建议使用GPU环境运行相关程序,可以在启动环境时,如下 ...

  7. 人大团队研究:面向文本生成,预训练模型进展梳理

    作者 | 刘媛媛 来源 | 数据实战派 文本生成是 NLP 中最重要且颇具挑战性的任务之一.近年来,预训练语言模型 (Pretrained Language Models ,下文简称 "PL ...

  8. 乘风破浪的PTM:两年来预训练模型的技术进展

    作者 | 张俊林 来源 | 深度学习前沿笔记专栏 Bert模型自18年10月推出,到目前为止快两年了.它卜一问世即引起轰动,之后,各种改进版本的预训练模型(Pre-Training Model, PT ...

  9. 刘群:华为诺亚方舟NLP预训练模型工作的研究与应用 | AI ProCon 2019

    演讲嘉宾 | 刘群(华为诺亚方舟实验首席科学家) 编辑 | Jane 出品 | AI科技大本营(ID:rgznai100) 预训练语言模型对自然语言处理领域产生了非常大的影响,在近期由CSDN主办的 ...

最新文章

  1. (最新最全)windows使用anaconda安装pytorch进行深度学习并使用GPU加速
  2. 【uni-app】 rich-text 中图片溢出
  3. 初三中考比一模能提高多少分?
  4. 用VC++建立Service服务应用程序
  5. PDFcrack暴力破解pdf密码
  6. 跳出坑爹的 Runtime Library 坑
  7. hough变换检测圆周_hough变换是如何检测出直线和圆的?
  8. 金蝶云苍穹平台初级开发工程师认证考试
  9. canvas抖音八卦时钟,轻喷
  10. SSL认证之相关证书的生成
  11. 堪萨斯大学计算机硕士,美国堪萨斯大学计算机工程研究生申请要求
  12. 移动端Touch (触摸)事件
  13. Django之stark组件1
  14. AS400 EBCDIC码转UTF-8码
  15. 生产者-消费者-管程法(java代码示例)
  16. Android 项目是如何编译成.apk的
  17. 基金从业资格考试(科目二):证券投资基金(第二版)上册 学习笔记
  18. N1盒子旁路由教程面向小白啰嗦版
  19. 构建自己的碎片知识体系
  20. NBA表格_双红!34中24!NBA季后赛【掘金vs湖人】

热门文章

  1. Verilog通过锁相环实现倍频,分频,相位偏移
  2. 计算机网络安全技术功能有哪些,计算机网络安全技术课件(一) 安全技.ppt
  3. EMC | 瞬态传导抗干扰试验与整改
  4. org.yaml.snakeyaml.scanner.ScannerException: while scanning for the next token found character ‘@‘
  5. java 基于注解实现动态级联下拉excel模板
  6. 下拉框的二级联动和回显
  7. LEARNING_CRYPTO|搭建个人以太坊测试网络+测试Solidity部署(Ganache+truffle)
  8. [渝粤教育] 四川农业大学 Java程序设计 参考 资料
  9. Go语言上云了,谷歌发布新开源项目Go Cloud!
  10. 高精度乘法(C++,高精度)