最终改好的调试文本蕴涵模型步骤:

1.安装环境,需要使用gpu环境,服务器上的cuda版本是10,需要安装相应的tensorflow版本

2.运行data_reader.py文件,生成cnli_vocab.txt

3.在model下运行run_embeddingcnli.sh文件,生成cnli_embedding.npy

4.运行train.py文件。

调试过程中出现的主要问题汇总如下:

1.配置环境,安装python版本3.6.5,anaconda版本Anaconda3-5.2.0。然后activate tensorflow,在tensorflow环境下又安装了tensorflow1.5,但是运行中出现错误,如下图所示

由于tensorflow版本不同,导致参数名称冲突,解决办法是:卸载当前tensorflow1.5,重新安装tensorflow1.4

但是使用cpu跑太慢,因此在服务器上重新搭建环境。

2.接下来在jupyter上运行train.py文件,出现问题提示:缺少D:\\12.txt,解决办法:创建该日志文件

3.run train.py ,出现问题:缺少mergetrain.txt,解决办法:这个文件实际是data/cnli/cnli_train_1.0_seg.txt,在config.py文件里(第21行)改一下名字即可,如下图所示

3.运行data_reader.py文件,生成nlpcc2016_vocab.txt,日期应该是刚刚创建的,那么这个文件就是cnli_vocab.txt

他们的区别是cnli是做蕴涵任务,而nlpcc是做问答任务

4.由于nlpcc2016_embedding.npy文件是通过运行run_embeddingcnli.sh之后自动生成的,因此要在电脑上安装git工具,运行sh文件,把run_embeddingcnli.sh文件放到model下,和data处于同一级目录下,如下图所示:

5.在运行过程中,发现编码错误'utf-8' codec can't decode byte 0x92 in position 3: invalid start byte,用emeditor打开综合词向量文件发现存在无效字符,因此把无效字符删除,再继续运行run_embeddingcnli.sh文件,生成的cnli_embedding.npy文件就是nlpcc2016_embedding.npy文件

6.继续运行train.py文件,发现错误如下图所示

因此,需要打开train.py文件,把pred赋值个0,然后再进行测试,即可成功。

虽然可以运行,但是还是出现一个问题,准确率都是0,如下图所示:

发现是data_reader.py文件中的load_data函数里面的label字典的参数错误了,应该改成如下图所示:

之后可以运行,但是准确率只有38,如下图所示,

然后师兄说问题有两个:

(1)npy词向量不对应,是代码中的问题(2)词典不对应

改好之后,再运行是train的准确率是58,然后会慢慢增加

用文本蕴涵模型测试百度的数据发现问题:

train的准确率是0,目前发现是因为 l 在 label词典中找不到,需要改一下格式:

把{'neutral':0,'entailment':1,'contradiction':2} 改成 {'  neutral':0,'  entailment':1,'  contradiction':2}

在测试的时候可以打印一下p,h,l,然后看看X[:10]中有没有值

在运行train.py文件时遇到错误:InvalidArgumentError (see above for traceback): indices[0,10] = 47392 is not in [0, 45100)

是因为换了数据,因此词典和npy文件都要重新生成

遇到错误Assign requires shapes of both tensors to match. lhs shape= [316297,300] rhs,可以把日志文件删除,并把model_saved_2016删除,是通过参考微博https://blog.csdn.net/Warship_/article/details/103817430

8.服务器gpu被占用,结果报错,错误如下图所示:

因此,使用命令nvidia-smi 查看当前服务器gpu使用情况,如下图:

具体的命令解读参考博客https://blog.csdn.net/sallyxyl1993/article/details/62220424

因此,可以使用gpu0进行跑程序,参考博客https://blog.csdn.net/guvcolie/article/details/77164230

在程序的最前面加入两行即可。

文本蕴涵模型测试过程相关推荐

  1. nmt模型源文本词项序列_「自然语言处理(NLP)」阿里团队--文本匹配模型(含源码)...

    来源:AINLPer微信公众号 编辑: ShuYini 校稿: ShuYini 时间: 2019-8-14 引言 两篇文章与大家分享,第一篇作者对通用文本匹配模型进行探索,研究了构建一个快速优良的文本 ...

  2. R语言构建文本分类模型:文本数据预处理、构建词袋模型(bag of words)、构建xgboost文本分类模型、基于自定义函数构建xgboost文本分类模型

    R语言构建文本分类模型:文本数据预处理.构建词袋模型(bag of words).构建xgboost文本分类模型.基于自定义函数构建xgboost文本分类模型 目录

  3. R语言构建xgboost文本分类模型(bag of words):xgb.cv函数交叉验证确定xgboost模型的最优子树个数、交叉验证获取最优子树之后构建最优xgboost模型并评估模型文本分类效能

    R语言构建xgboost文本分类模型(bag of words):xgb.cv函数交叉验证确定xgboost模型的最优子树个数.交叉验证获取最优子树之后构建最优xgboost模型并评估模型文本分类效能 ...

  4. R语言构建文本分类模型并使用LIME进行模型解释实战:文本数据预处理、构建词袋模型、构建xgboost文本分类模型、基于文本训练数据以及模型构建LIME解释器解释多个测试语料的预测结果并可视化

    R语言构建文本分类模型并使用LIME进行模型解释实战:文本数据预处理.构建词袋模型.构建xgboost文本分类模型.基于文本训练数据以及模型构建LIME解释器解释多个测试语料的预测结果并可视化 目录

  5. R语言构建文本分类模型:文本数据预处理、构建词袋模型(bag of words)、构建xgboost文本分类模型、xgboost模型预测推理并使用混淆矩阵评估模型、可视化模型预测的概率分布

    R语言构建文本分类模型:文本数据预处理.构建词袋模型(bag of words).构建xgboost文本分类模型.xgboost模型预测推理并使用混淆矩阵评估模型.可视化模型预测的概率分布 目录

  6. R使用LSTM模型构建深度学习文本分类模型(Quora Insincere Questions Classification)

    R使用LSTM模型构建深度学习文本分类模型(Quora Insincere Questions Classification) Long Short Term 网络-- 一般就叫做 LSTM --是一 ...

  7. NLP文本生成模型数据准备及实战

    NLP文本生成模型数据准备及实战 自然语言处理+数据准备 Machine readable vector format 自然语言处理NLP的数据预处理有哪些共性,可以参考? 什么样的数据格式是深度学习 ...

  8. 实体链接(Entity Linking)、依存句法分析、成分句法树、词袋模型、文本向量空间模型(TF-IDF)、

    实体链接(Entity Linking).依存句法分析.成分句法树.词袋模型.文本向量空间模型(TF-IDF) 目录

  9. 自然语言处理NLP之文本蕴涵、智能问答、语音识别、对话系统、文本分类、情感计算

    自然语言处理NLP之文本蕴涵.智能问答.语音识别.对话系统.文本分类.情感计算 目录

  10. 【多标签文本分类】融合CNN-SAM与GAT的多标签文本分类模型

    ·阅读摘要:   在本文中,作者基于CNN.Attention.GAT提出CS-GAT模型,在一些通用数据集上,表现良好. ·参考文献:   [1] 融合CNN-SAM与GAT的多标签文本分类模型   ...

最新文章

  1. reactjs Context的使用:一种组件间的通信方式
  2. Linux chmod
  3. 【shell基础】10、函数
  4. php动态交叉表,PHP Array交叉表实现代码
  5. mysql 备份库的shell_linux备份Mysql数据库shell_MySQL
  6. 利用cloudera manager搭建Hadoop集群
  7. 剑指offer JZ02/05 替换空格 Python
  8. matlab进行分子动力学模拟,一种基于分子动力学模拟测试碳纳米管力学性能的方法与流程...
  9. python捕获键盘按键_Python中捕获键盘的方式详解
  10. 101107 ~101113
  11. 树莓派/arm设备上安装火狐Firefox浏览器
  12. java pdf 水印_java 如何给pdf文件加水印
  13. 在Java中构建响应式微服务系统——第三章 构建响应式微服务
  14. 用ArcGIS制作核密度分析图
  15. 微信公众平台针对欺诈等违规行为处理结果公示
  16. 【前端进阶】前端进阶知识补充
  17. 软考是什么?软考有什么作用?
  18. 面试造火箭,秋招建大楼!阿里新出《Java权威面试指南》堪称精品!
  19. NEC Programming Contest 2021(AtCoder Beginner Contest 229) B - Hard Calculation
  20. redhat各版本和下载地址

热门文章

  1. 骗的就是你!揭露买本10大愚蠢表现
  2. ios12卡贴机(有锁)/无锁机 改电信VOLTE //高通基带//教程
  3. 京东平台开发者入驻指南
  4. 拥抱变化—— 可扩展性杂谈
  5. 来自2018年最后的瞎扯——从“空间”到“强人工智能”
  6. 做数据分析很重要的思维模式!!!
  7. windows11 解决桌面缩放模糊的问题
  8. 脱壳工具 postern.apk文件
  9. .NET pfx文件解析私钥和公钥
  10. 【错误记录】Kotlin 报错 ( Some kotlin libraries attached to this project were compiled with a newer kotlin )