解决SiamRPN预训练模型的问题
加入预训练模型,若是报类似以下的错误:
Unexpected key(s) in state_dict: "layer1.0.weight", "layer1.0.bias", "layer1.1.weight", "layer1.1.bias", "layer1.1._var", "layer2.0.weight", "layer2.0.bias", "layer2.1.weight", "layer2.1.bias", "layer2.1.running_mean", "layer2.1.running_v0.bias", "layer3.1.weight", "layer3.1.bias", "layer3.1.running_mean", "layer3.1.running_var", "layer4.0.weight", "layer4.0.4.1.bias", "layer4.1.running_mean", "layer4.1.running_var", "layer5.0.weight", "layer5.0.bias", "layer5.1.weight", "layer5., "layer5.1.running_var".
最直接的方法,放与代码网络匹配的预训练模型!!!
其他的比较好找,就不提供了。这里提供一个匹配Tularov Arbi复现的SiamRPN预训练模型,链接如下:
https://pan.baidu.com/s/1road7tNSIc65VRjtiDSTiw提取码:69nq
还是要推荐一下Tularov Arbi复现的SiamRPN代码。这个代码看着很舒服、很整洁。比较容易看懂。
下面解决的方法就比较复杂了!!!
出现上述错误,因为我们构建的网络模型和加入的预训练模型的key值不对应。说key值可能不太好理解。用下面例子简单说一下:
预训练模型构建的网络:
我们自己构建的网络:
如上所示,self.layer1就好比keys。 而我们的是self.featureExtractd,这两是没有办法对应上的。所以运行的时候就报出现意外的keys的错误。
我们按着预训练模型keys值的结构,重新构建我们的网络就可以了。还有一点这样重新构建可以解决上述问题。但是想运行通可能还需要改一些地方的代码,这就需要按着你的代码要求去修改了!
最后放一个查看模型key值的代码:
checkpoint = torch.load(config.pretrained_model, map_location='cpu')for k,v in checkpoint.items():print(k)print("hcc-wyq")
解决SiamRPN预训练模型的问题相关推荐
- 「NLP」ALBERT:更轻更快的NLP预训练模型
目前在NLP领域,出彩的预训练模型的新工作,几乎都是基于BERT的改进,前面我们就介绍了XLNET.今天我来介绍一个更新的工作,相比于BERT,它更轻量,效果也要好. 作者 | 小Dream哥 编辑 ...
- 【NLP】ALBERT:更轻更快的NLP预训练模型
目前在NLP领域,出彩的预训练模型的新工作,几乎都是基于BERT的改进,前面我们就介绍了XLNET.今天我来介绍一个更新的工作,相比于BERT,它更轻量,效果也要好. 作者&编辑 | 小Dre ...
- 《预训练周刊》第23期:Smart Bird:解决变换器性能瓶颈的新方法、Prompt:如何提升预训练模型的迁移效果...
No.23 智源社区 预训练组 预 训 练 研究 观点 资源 活动 关于周刊 超大规模预训练模型是当前人工智能领域研究的热点,为了帮助研究与工程人员了解这一领域的进展和资讯,智源社区整理了第23期&l ...
- 智能文档理解:通用文档预训练模型
预训练模型到底是什么,它是如何被应用在产品里,未来又有哪些机会和挑战? 预训练模型把迁移学习很好地用起来了,让我们感到眼前一亮.这和小孩子读书一样,一开始语文.数学.化学都学,读书.网上游戏等,在脑子 ...
- BERT的通俗理解 预训练模型 微调
1.预训练模型 BERT是一个预训练的模型,那么什么是预训练呢?举例子进行简单的介绍 假设已有A训练集,先用A对网络进行预训练,在A任务上学会网络参数,然后保存以备后用,当来一 ...
- Paddle预训练模型应用工具PaddleHub
Paddle预训练模型应用工具PaddleHub • 本文主要介绍如何使用飞桨预训练模型管理工具PaddleHub,快速体验模型以及实现迁移学习.建议使用GPU环境运行相关程序,可以在启动环境时,如下 ...
- 人大团队研究:面向文本生成,预训练模型进展梳理
作者 | 刘媛媛 来源 | 数据实战派 文本生成是 NLP 中最重要且颇具挑战性的任务之一.近年来,预训练语言模型 (Pretrained Language Models ,下文简称 "PL ...
- 乘风破浪的PTM:两年来预训练模型的技术进展
作者 | 张俊林 来源 | 深度学习前沿笔记专栏 Bert模型自18年10月推出,到目前为止快两年了.它卜一问世即引起轰动,之后,各种改进版本的预训练模型(Pre-Training Model, PT ...
- 刘群:华为诺亚方舟NLP预训练模型工作的研究与应用 | AI ProCon 2019
演讲嘉宾 | 刘群(华为诺亚方舟实验首席科学家) 编辑 | Jane 出品 | AI科技大本营(ID:rgznai100) 预训练语言模型对自然语言处理领域产生了非常大的影响,在近期由CSDN主办的 ...
最新文章
- (最新最全)windows使用anaconda安装pytorch进行深度学习并使用GPU加速
- 【uni-app】 rich-text 中图片溢出
- 初三中考比一模能提高多少分?
- 用VC++建立Service服务应用程序
- PDFcrack暴力破解pdf密码
- 跳出坑爹的 Runtime Library 坑
- hough变换检测圆周_hough变换是如何检测出直线和圆的?
- 金蝶云苍穹平台初级开发工程师认证考试
- canvas抖音八卦时钟,轻喷
- SSL认证之相关证书的生成
- 堪萨斯大学计算机硕士,美国堪萨斯大学计算机工程研究生申请要求
- 移动端Touch (触摸)事件
- Django之stark组件1
- AS400 EBCDIC码转UTF-8码
- 生产者-消费者-管程法(java代码示例)
- Android 项目是如何编译成.apk的
- 基金从业资格考试(科目二):证券投资基金(第二版)上册 学习笔记
- N1盒子旁路由教程面向小白啰嗦版
- 构建自己的碎片知识体系
- NBA表格_双红!34中24!NBA季后赛【掘金vs湖人】
热门文章
- Verilog通过锁相环实现倍频,分频,相位偏移
- 计算机网络安全技术功能有哪些,计算机网络安全技术课件(一) 安全技.ppt
- EMC | 瞬态传导抗干扰试验与整改
- org.yaml.snakeyaml.scanner.ScannerException: while scanning for the next token found character ‘@‘
- java 基于注解实现动态级联下拉excel模板
- 下拉框的二级联动和回显
- LEARNING_CRYPTO|搭建个人以太坊测试网络+测试Solidity部署(Ganache+truffle)
- [渝粤教育] 四川农业大学 Java程序设计 参考 资料
- Go语言上云了,谷歌发布新开源项目Go Cloud!
- 高精度乘法(C++,高精度)