简介

NLM Medical Text Indexer (MTI),医学文本索引,顾名思义,作用是输入一段医学文本,输出相应的关键字。官网链接https://ii.nlm.nih.gov/MTI/。

如何使用MTI

MTI提供三种使用方式:

  1. MeSH on Demand
    链接 https://meshb.nlm.nih.gov/MeSHonDemand,使用方式很简单,复制一段文本,关键词会高亮显示,截张图。
  2. Batch-Mode (Requires UTS Account)
    需要账号,目前我还在申请阶段,进不去。
  3. Download our Web API (Requires UTS Account)
    使用官方提供的API接口,这是很实用的一种方法。web api使用介绍

Web API 教程

  • 下载SKR_Web_API_V2_3.jar

  • 解压jar包,即工程文件

Windows: winzip, pkzip, or zip解压就行
Unix、Linux、Mac
$ java sun.tools.jar.Main xf SKR_Web_API_V2_3.jar
  • 打开工程文件,examples目录下几个java文件,新建一个Test.java, 代码如下. 注意用户名、密码、邮箱、txt文件的绝对路径。

关键部分代码

Test.java

import gov.nih.nlm.nls.skr.GenericObject;public class Test {public static void main(String[] args) {GenericObject myGenericObj = new GenericObject("你的用户名", "你的密码");myGenericObj.setField("Email_Address", "你的邮箱");myGenericObj.setFileField("UpLoad_File", "/Users/wanglei/Downloads/CXR1.txt"); # 注意是绝对路径,相对路径出错myGenericObj.setField("Batch_Command", "MTI -opt1L_DCMS -E");myGenericObj.setField("BatchNotes", "SKR Web API test");myGenericObj.setField("SilentEmail", true);try{String results = myGenericObj.handleSubmission();System.out.print(results);} catch (RuntimeException ex) {System.err.println("");System.err.print("An ERROR has occurred while processing your");System.err.println(" request, please review any");System.err.print("lines beginning with \"Error:\" above and the");System.err.println(" trace below for indications of");System.err.println("what may have gone wrong.");System.err.println("");System.err.println("Trace:");ex.printStackTrace();} // catch}
}

结果展示

医学文本CXR1.txt

Normal chest x-XXXX.The cardiac silhouette and mediastinum size are within normal limits. There is no pulmonary edema. There is no focal consolidation. There are no XXXX of a pleural effusion. There is no evidence of pneumothorax.

得到的results

结束语

如果需要批量处理医学文本得到相应的标签、关键字,需要使用官方提供API接口,自己写代码。
注意代码中txt文件填写绝对路径,我原本照着官网给的相对路径会报找不到文件的错。
附上我的项目链接:
https://github.com/wangleihitcs/MTI

NLM Medical Text Indexer (MTI)相关推荐

  1. [论文阅读笔记30]关于pico抽取的研究-1(4篇文献)

    论文1:Extracting PICO elements from RCT abstracts using 1-2gram analysis and multitask classification ...

  2. 一些开源搜索引擎实现——倒排使用原始文件,列存储Hbase,KV store如levelDB、mongoDB、redis,以及SQL的,如sqlite或者xxSQL...

    本文说明:除开ES,Solr,sphinx系列的其他开源搜索引擎汇总于此. A search engine based on Node.js and LevelDB A persistent, net ...

  3. 今日arXiv精选 | 29篇顶会论文:ACM MM/ ICCV/ CIKM/ AAAI/ IJCAI

     关于 #今日arXiv精选  这是「AI 学术前沿」旗下的一档栏目,编辑将每日从arXiv中精选高质量论文,推送给读者. Group-based Distinctive Image Captioni ...

  4. 请查收!顶会AAAI 2020录用论文之自然语言处理篇

    文章目录 自然语言处理篇(NLP)         Question Answering         Sequence Labeling         Semantics and Summari ...

  5. 他山之石 | 丁香园 医疗领域图谱的构建与应用

    作者 | 付子玉 编辑 | DataFun 大家好,这里是NewBeeNLP.今天分享丁香园nlp组联合华师大团队发表的文章SMedBERT,在医疗垂直领域下将知识图谱的医学实体和实体的结构化信息引入 ...

  6. 图谱实战 | 丁香园医疗领域图谱的构建与应用

    分享嘉宾:付子玉 观澜网络 算法工程师 编辑整理:孙佩霞 中国电信研究院 出品平台:DataFunTalk 导读:丁香园大数据组旨在为用户提供更优质的内容与服务,使用知识/概念图谱.预训练模型挖掘更深 ...

  7. 付子玉:丁香园医疗领域图谱的构建与应用

    本文约4500字,建议阅读10+分钟 本文介绍了丁香园nlp组联合华师大团队发表的文章SMedBERT,并介绍了丁香园在业务场景下的一些应用. 分享嘉宾:付子玉 观澜网络 算法工程师 编辑整理:孙佩霞 ...

  8. 【论文汇总】2020上半年阿里、腾讯、百度入选AI顶会论文(附地址)

    (给机器学习算法与Python学习加星标,提升AI技能) 本文由数据派整理 2020年已过近半,人工智能学术界的顶级会议也举行了不少.在今年已经举行的顶会中,腾讯.百度.阿里等国内科技巨头被收录论文在 ...

  9. 一文看尽2020上半年阿里、腾讯、百度入选AI顶会论文

    2020年已过近半,人工智能学术界的顶级会议也举行了不少.在今年已经举行的顶会中,腾讯.百度.阿里等国内科技巨头被收录论文在数量和质量上均有所突破,涉及机器学习.自然语言处理.计算机视觉等多个领域.下 ...

最新文章

  1. 【入门篇】如何正确使用机器学习中的训练集、验证集和测试集?
  2. 关于Spring Cloud 框架热部署的方法
  3. android studio文件风格,Android Studio构建风格 – 如何拥有不同风格的相同源文件
  4. 实现iOS App的在线安装
  5. 华强北AirPods洛达1562A固件升级教程,带空间音频(艾创力+东莞豪锐)
  6. 维修三菱油妍服务器,三菱油研伺服驱动器常见报警AL17,AL19,AL1A
  7. Openv 线性插值
  8. 基于multisim的电子秒表
  9. word 导出编辑ftl_word文档转化成ftl文件
  10. 2021年下半年软件设计师上午真题答案及解析(三)
  11. 程序设计入门——C语言 翁恺 第1周编程练习
  12. javascript--浅谈函数与闭包
  13. Linux 内核编译安装
  14. 【Qt】 Fractal Designer 4.6 - Help(中文版)
  15. 05古诗生成项目(pytorch)(观看b站视频的笔记,代码即将实现)
  16. 实现个人微信同时接收企业号消息
  17. MODBUS协议规范学习记录
  18. 【嵌入式系统开发】学习笔记四:嵌入式开发的基本概念与工具链
  19. php取出字符串数字部分,php提取字符串中数字文字片段的方法大全 - 乖兔博客
  20. [转载]carbide2.0如何联机调试

热门文章

  1. CSS 盒子居中详解
  2. 【调剂】江苏大学2020年硕士研究生拟调剂信息
  3. unity黑白滤镜_unity游戏相机滤镜渲染后期色彩处理特效着色器Colorful FX v4.4
  4. c语言:求长方体的体积和表面积
  5. 第四战,三打祝家庄(注意,此三打是统称一打、二打、三打祝家庄这几仗)
  6. 微型计算机工作总结,2017-2018学年度微机室管理工作总结
  7. 持续更新:关于写代码严谨性
  8. C++ 命令行版贪吃蛇(附下载地址)
  9. 解决Execution failed for task‘:app:mergeDebugResources...
  10. BNUOJ-4716题 IQ test