之前用的常规爬虫思路(import requests,from bs4 import BeautifulSoup)来下载文章题目,作者,来源等信息时, 偶尔会出现各种问题,有那个调试的时间,就自己根据biopython快速写了一个脚本 ,简单好用。

# !bin/python
# encoding:utf-8from Bio import Entrez
from  Bio  import Medline
Entrez.email = 'xxxx@qq.com'
ref = open('ref.txt','w+')
def downref(pmid):handle = Entrez.efetch(db="pubmed" , id=pmid , rettype="medline" , retmode="text")records = Medline.parse(handle)records = list(records) # records 是一个迭代器,所以只能访问这些records一次。如果想保存这些records,需要把他们转成列表。for record in records:print "title:" , record.get("TI" , "?")if len(record.get("AU" , "?"))>3: author = ','.join(record.get("AU" , "?")[0:3]) #如果名字很多时,作者名字取前三个print "authors:",authorelse:author =','.join(record.get("AU" , "?"))print "authors:",authorprint "source:" , record.get("SO" , "?")text = record.get("TI" , "?")+'\t'+ author +'\t' +record.get("SO" , "?") +'\n'ref.write(text)if __name__=="__main__":ids = ['21142915','25007187','27574448','16330681','24404132','22868256','23314736','18221820','24338217','17537913','19016765','22124095','18551042','17194903','22546611','22304580','22838950','21642870','19376514','20665488','24647007','23603345','23816762','19203783','25495407','21057378','22329723','21902499','21635146','24215845','22188361','19786980','21362365','21449681','24193570','17457342','19307503','20634689','17700593','23736036','20385995','25331073','24732178','20638924','21605004','22134350','17602053','20226083','18538455','18538445','24361227','16609362','18294295','21995462','26641474','18347181','26696550','19052714','18357466','24533712','23588304','19898482','2953022','26857783','20562211','19450125','15007088','16636344','23860526','20125120','24061601','25069034','20078613','19620936','27498158','25592234','24446315','19362955','16875718','22821704','17352537','18377430','19214144','23222202','24300978','22838949','23230131','16551864','24980784','27150640','25084203','22843789','20212519','16890579','26763541','22441531','21521023'] #可以读文件来输入pmidfor id in ids:downref(id)

参考:https://blog.csdn.net/Cassiel60/article/details/90664558

利用Biopython 快速根据pmid 来下载参考文献信息相关推荐

  1. 利用eoLinker快速录入Api接口文档信息

    传统的接口信息录入过程太过繁琐,而最近在线接口文档编写的平台变得越来越多,我参考了知乎上推荐的几款接口平台,eoLinker是用过几天之后觉得还不错的,特此记录一下如何通过它来实现快速录入Api接口文 ...

  2. ce查找人物基址,利用CE快速找到游戏内角色基址信息的方法!

    一.如何快速找到游戏内角色基址信息: 1. 首先打开CE加载游戏进程,选择扫描类型"精确数值",点击"首次扫描"游戏当前血或蓝的当前数值,一般至少找到1500个 ...

  3. 从endnote导出参考文献发现没有参考文献信息

    真是太惨了!辛辛苦苦导进去的文献没有参考信息!这不是玩我呢吗. 首先,部分英文文献和所有的中文文献无法显示参考文献信息. 没有参考消息怎么办呢,当然是重新下载参考文献信息啦! 1. 搜索文献下载参考信 ...

  4. python 下载qq群文件_利用多线程快速下载腾讯QQ群文件的方法

    引言: 众所周知,用QQ客户端下载QQ群文件的速度实在是缓慢,这里讲一下如何利用多线程快速下载腾讯QQ群文件. 原始事件发生在2018年8月4日,笔者的同学制作了一个毕业短片并且将其上传到了班级的QQ ...

  5. 190410-4步利用EndNote批量下载参考文献及施引文献

    参考文献如何利用EndNote批量下载文章 Step1: 登陆Web of Science官网 https://apps.webofknowledge.com Step2: 搜索需要检索的文章并点击进 ...

  6. 怎样利用DOI快速检索文献?

    什么是DOI DOI是数字资源终身不变的唯一编码. DOI是Digital Object Identifier的缩写,从形式上看,就是一个不重复的字符串,也叫唯一标识符,是国际通用.全球唯一.终身不变 ...

  7. CentOS 5.5 编译安装apache+php+mysql,利用CMS快速建立论坛

    这个是转来的,细节没有验证,请网友自己斟酌.......... CentOS 5.5 编译安装apache+php+mysql,利用CMS快速建立论坛 1.安装Apache [root@bogon t ...

  8. 利用vagrant快速搭建rails开发环境

    为什么80%的码农都做不了架构师?>>>    Deprecated 前言 当我们学习一门新的语言或技术的时候,最麻烦或比较浪费时间的事情就是搭建开发环境.而搭建开发环境与我们将要学 ...

  9. 教你一招利用Python快速去除图片水印

    大家好,我是IT界搬运工. 相信大家都有在网上下载好图片但是有水印的烦恼,那么问题就来了:看到心爱的图片想要"占为己有".怎么把图片上的水印去除呢?今天我就来教你一招利用Pytho ...

最新文章

  1. java rectangle获取xy_JFreeChart 动态移动线 并求出两条线交点XY
  2. 性能媲美BERT,但参数量仅为1/300,这是谷歌最新的NLP模型
  3. AWS — AWS Outposts
  4. 盘点区块链的2018:技术与工具演进篇
  5. 计算机视觉,图像处理 经典代码paper整理(很全很强大!)
  6. CEPH给用户创建读写权限
  7. php 403 nginx,403nginx是什么
  8. WordPress博客主题KRATOS双栏响应式博客主题
  9. webStrom破解链接
  10. CODE Unicode roleName_字符类型数据 人物名子
  11. 英国发现巨型失落海底世界:曾生活数万居民
  12. iOS 11 NSPhotoLibraryAddUsageDescription 错误的解决办法
  13. 2022年全球市场介质浆料总体规模、主要生产商、主要地区、产品和应用细分研究报告
  14. VB 变量的声明及作用域
  15. arcgis将直线等分_如何快速定数等分一条线段?
  16. 硬件设计—数字电路常用设计准则
  17. 【搭建方案】国标GB28181视频平台EasyGBS流媒体服务器如何实现小区安防监控系统的网页直播?
  18. 什么情况下应该选用远心镜头
  19. 基于python,虹软sdk3.0实现的实时人脸识别
  20. 以太坊ETH开发资源合集

热门文章

  1. babylon.js小人快跑动画效果
  2. 达梦8 DCA认证笔记
  3. HR最不喜欢的六类求职者
  4. 开启Atcoder之路
  5. UIFont-动态字体
  6. 《Arduino直流电机控制教程》
  7. 腾讯通服务器删除离线消息,如何撤回RTX离线消息离线文件.docx
  8. 初学Java常用设计模式之——工厂模式
  9. idea 报org.apache.ibatis.binding.BindingException: Invalid bound statement
  10. 如何选择好的软件测试技术?