在深度学习模型中,有时需要避免输入的是一段话而不是一个句子。我们需要把一段话分割成多个短句子,比如:

目前诊断:1、肺癌pT1cN0M0R0切除,IA期,EGFR(+)2、化疗后骨髓抑制3、高血压病。长期住院原因分析及针对性诊疗计划:患者肺癌复发,目前行同步放化疗,放疗时间较长,需要长期住院治疗。

将句号作为分割点,将这句话分割成两句话,每句话作为模型的输入,这样做的原因是:防止输入句子太长,模型在处理时将关键信息裁剪,此时就抽取不出想要的信息了。
代码实现如下:

cur_seedtext = '目前诊断:1、肺癌pT1cN0M0R0切除,IA期,EGFR(+)2、化疗后骨髓抑制3、高血压病。长期住院原因分析及针对性诊疗计划:患者肺癌复发,目前行同步放化疗,放疗时间较长,需要长期住院治疗。'
cur_seedtext = cur_seedtext.replace('。','@@@')
cur_seedtext = '。\n'.join([x.strip() for x in cur_seedtext.split('@@@')])
print(cur_seedtext)

在医疗病例单中使用命名实体识别技术提取医生对患者的诊断时,利用此方法就可以用模型单独对句子进行处理,这样的效果似乎更好。

以下是上面的代码对段落的处理结果

目前诊断:1、肺癌pT1cN0M0R0切除,IA期,EGFR(+)2、化疗后骨髓抑制3、高血压病。
长期住院原因分析及针对性诊疗计划:患者肺癌复发,目前行同步放化疗,放疗时间较长,需要长期住院治疗。

mediecalNER模型的识别结果为

[
{"start": 7,
"stop": 20,
"word": "肺癌pT1cN0M0R0切除",
"type": "BODY"
},
{"start": 22,
"stop": 24,
"word": "IA期",
"type": "BODY"
},
{"start": 26,
"stop": 32,
"word": "EGFR(+)",
"type": "BODY"
},
{"start": 44,
"stop": 47,
"word": "高血压病",
"type": "BODY"
}
]
-------------------------------------
[]
-------------------------------------

显然模型识别出了第一句话中提出的几个诊断病情,但是精度没那么高。。。

python深度学习NER任务中:对段落的分割相关推荐

  1. Python深度学习一书中: 8.4代码VAE在tensorflow2.0错误‘lambda_1/random_normal/shape‘的解决方案

    Python深度学习一书中: 8.4代码VAE在tensorflow2.0下会有Duplicate node name in graph: 'lambda_1/random_normal/shape' ...

  2. Python深度学习-NLP实战:命名实体识别(NER)之分词与序列标注、实体识别任务简介

    系列文章目录 Python深度学习-NLP实战:深度学习系列培训教程 Linux服务器软件的简单使用 Linux命令的简单使用 训练集.测试集.验证集的介绍及制作 字向量的训练与生成 文本分类之SVM ...

  3. 如何在Python深度学习中设置GPU卡号

    诸神缄默不语-个人CSDN博文目录 本文介绍在Python深度学习代码运行的过程中,如何设置GPU卡号(包括PyTorch和TensorFlow适用的写法),主要适用于单卡场景,以后可能会增加多卡场景 ...

  4. 微信高级研究员解析深度学习在NLP中的发展和应用 | 公开课笔记

    作者 | 张金超(微信模式识别中心的高级研究员) 整理 | Just 出品 | 人工智能头条(公众号ID:AI_Thinker) 近年来,深度学习方法极大的推动了自然语言处理领域的发展.几乎在所有的 ...

  5. 微信高级研究员解析深度学习在 NLP 中的发展和应用

    近年来,深度学习方法极大的推动了自然语言处理领域的发展.几乎在所有的 NLP 任务上我们都能看到深度学习技术的应用,并且在很多的任务上,深度学习方法的表现大大的超过了传统方法.可以说,深度学习方法给 ...

  6. Python深度学习-NLP实战:字向量的训练与生成

    系列文章目录 Python深度学习-NLP实战:深度学习系列培训教程 Linux服务器软件的简单使用 Linux命令的简单使用 训练集.测试集.验证集的介绍及制作 字向量的训练与生成 文本分类之SVM ...

  7. Python深度学习篇六《深度学习用于文本和序列》

    前言 前期回顾: Python深度学习篇五<深度学习用于计算机视觉> 上面这篇里面写了计算机视觉相关. 卷积神经网络是解决视觉分类问题的最佳工具. 卷积神经网络通过学习模块化模式和概念的层 ...

  8. python神经结构二层_《python深度学习》笔记---8.3、神经风格迁移

    <python深度学习>笔记---8.3.神经风格迁移 一.总结 一句话总结: 神经风格迁移是指将参考图像的风格应用于目标图像,同时保留目标图像的内容. 1."神经风格迁移是指将 ...

  9. Python深度学习之搭建小型卷积神经网络(Kaggle网站Dogs-vs-Cats数据集)

    完全来源与<Python深度学习>中的例子,仅供学习只用. Cats vs. Dogs(猫狗大战)是Kaggle大数据竞赛的数据集,数据集由训练数据和测试数据组成,训练数据包含猫和狗各12 ...

最新文章

  1. android layout analyze
  2. TreeMap方法源码
  3. labview数据枚举数据服务器,枚举器报告'未指定的错误,不能枚举服务器
  4. Docker 使用Dockerfile构建自己的docker服务(三)
  5. Dell R730 服务器重装系统Ubuntu16.04
  6. python三层for循环_Python基础入门-For循环
  7. python安装软件win10_在win10上安装Python和Tensorflow
  8. 通信模块整理(一)JDY-31
  9. 【搬运】不思议的小故事,其实舰娘们也是有灵性的
  10. 18年怎么将win7升级到win10教程
  11. 离散数学 第一章 部分课后习题
  12. opencv+python图像匹配——模版匹配、特征点匹配
  13. [开源之美] nanomsg -- 进程间通讯
  14. c++ 十六进制转二进制数_二进制数制
  15. linux wifi信道,2.4G wifi 的频道/信道 20M 40M的概念,区别
  16. 排雷日记 -- mybatisplus分页查询效率
  17. 电脑自带的cmd/Powershell连接远程服务器(实用技巧)
  18. Codeforces 227E/226C Anniversary 斐波那契数列性质+矩阵快速幂
  19. 【Windows逆向】Windows进程动态patch入门+pyqt5搭建GUI
  20. 《中国垒球协会》:新春贺词

热门文章

  1. ASP.NET MVC项目 解决session失效
  2. 持续集成工具Hudson安装实例
  3. Wdcp在安装memcached出现错误的解决办法
  4. matlab编译器和程序发布
  5. 利用passssh,批量远程修改机器密码
  6. mysql数据库上传ftp服务器中_备份部分mysql表并上传至指定ftp服务器目录中
  7. 字符串原样输出程序python_Python格式化字符串(格式化输出)
  8. c语言编程单向链表排序,【分享】C语言 简单链表创建 排序 输出
  9. 吴恩达 matlab,吴恩达机器学习记录--Matlab 一些基本操作
  10. python输入水果求个数问题_水果爱好者:用Python解决一个简单的分类问题