首先在ncbi的搜索页面上用关键词进行搜索,确认符合条件的结果数。由于搜索页面上分页显示的,不能一次得到大量的序列信息。要一次得到所有的序列Id,可以使用esearch服务。比如以carabus为关键词搜索nucleotide库。在搜索页面得到的结果数是4000左右,
根据初步搜索的结果数,调整下面链接中的retmax参数至比结果数略大或至少相等,这里设为5000。
http://eutils.ncbi.nlm.nih.gov/entrez/eutils/esearch.fcgi?db=nucleotide&term=carabus&retmax=5000&usehistory=y

其中retmax为返回结果最大条数;usehistory指定保存搜索结果供下一步(比如efetch服务)使用。在浏览器地址栏中键入上述网址,回车,回返回一个包含了所有符合条件记录的Id的xml文件。这一步返回的结果中还会有WebEnv和QueryKey两个值,WebEnv实际上就是对上一步保存结果的引用。如果你只需要Ids,到这一步够了。如果需要所有Id对应的序列或更多信息,可以使用的efetch服务。将WebEnv和QueryKey这两个值替换下面这个链接的相应值:
http://eutils.ncbi.nlm.nih.gov/entrez/eutils/efetch.fcgi?db=nucleotide&WebEnv=xxxxx&retmax=5000&rettype=fasta&retmode=text&query_key=1
rettype即返回结果类型,可以为native/fasta等,缺省为native。
retmode即返回结果格式,可以设置为xml/html/text等,具体参见efetch的说明。在浏览器地址栏中键入上述网址,回车,一个包含4000多条序列的fasta格式的文件就开始下载了。

附esearch和efetch服务具体说明网址:
1. http://eutils.ncbi.nlm.nih.gov/corehtml/query/static/esearch_help.html
2. http://eutils.ncbi.nlm.nih.gov/corehtml/query/static/efetchseq_help.html

转载于:https://www.cnblogs.com/agateriver/archive/2009/10/03/1577696.html

利用entrez提供的web服务快速下载大批量序列信息相关推荐

  1. shttpd php,shttpd和Lua组合-提供嵌入式web服务

    简单介绍: lua是一个小巧的脚本语言,专用于嵌入和扩展.它和C/C++代码有着良好 的交互能力.由于体积小,很适合嵌入到其他程序中为程序提供脚本功能. lua在大多数平台上都可以顺利编译.运行.网址 ...

  2. 让你的 wowza server提供 RESTful web 服务

    有时我们 nginx 须要和 wowza 服务器交互以进行一些 LB 事宜:有时我们的管理员须要实时了解 wowza 服务器的一些其它状态信息(比方一些自己定义对象的状态等等).而用 rtmp 不是太 ...

  3. 让你的 wowza 服务器提供 RESTful web 服务

    有时我们 nginx 需要和 wowza 服务器交互以进行一些 LB 事宜:有时我们的管理员需要实时了解 wowza 服务器的一些其他状态信息(比如一些自定义对象的状态等等),而用 rtmp 不是太方 ...

  4. SAP 如何提供 RESTful Web 服务?

    SAP 推荐以 OData 方式提供 Restful Service.Netweaver 7.4 之后的版本可以直接使用 OData 服务.7.4 之前的版本需要升级 GW_CORE.IW_FND 和 ...

  5. 一文讲透推荐系统提供web服务的2种方式

    作者丨gongyouliu 编辑丨zandy 来源 | 大数据与人工智能(ID: ai-big-data) 推荐系统是一种信息过滤技术,通过从用户行为中挖掘用户兴趣偏好,为用户提供个性化的信息,减少用 ...

  6. IBM Lotus Domino 7 中的实用 Web 服务,第 1 部分: 什么是 Web 服务以及它们为何如此重要

    Julian Robichaux, 开发人员, 独立顾问 Julian Robichaux 是专门研究 IBM Lotus Notes 和 Java 开发的软件开发人员和专业程序员.他擅长于各种与开发 ...

  7. IBM Lotus Domino 7 中的实用 Web 服务,第 1 部分: 什么是 Web 服务以及它们为何如此重要...

    IBM Lotus Domino 7 中的实用 Web 服务,第 1 部分: 什么是 Web 服务以及它们为何如此重要 级别: 初级 Julian Robichaux, 开发人员, 独立顾问 2005 ...

  8. Linux集群服务知识点总结及通过案例介绍如何实现高性能web服务

    转自:http://guodayong.blog.51cto.com/263451/1201101 一:集群相关概念及知识点介绍: LVS(Linux Virtual System) 本项目在1998 ...

  9. Web服务(Apache、Nginx、Tomcat、Jetty)与应用(LAMP、CMS-WordPressGhost、Jenkins、Gitlab)

    Web服务和应用是目前信息技术领域的热门技术.如何使用Docker来运行常见的Web服务器(包括Apache.Nginx.Tomcat等),以及一些常用应用(LAMP.CMS等).包括具体的镜像构建方 ...

最新文章

  1. C++中关于[]静态数组和new分配的动态数组的区别分析
  2. pymysq向mysql写数据 为什么本地无法查看_从运维角度浅谈MySQL数据库优化,中小企业DBA必会...
  3. 谈谈Android重打包--初语
  4. 麒麟970怎么升级鸿蒙系统,华为这些手机无法升级鸿蒙系统,搭载麒麟970,只能遗憾错过...
  5. sql判断邮箱是否合法_分享一个oracle身份证校验函数,判断你的身份证是否合法...
  6. 数据库以及表的基本操作
  7. chart.js雷达图不显示刻度标签_Matplotlib从入门再也不放弃
  8. javascript阻止事件冒泡和浏览器的默认行为
  9. Pycharm Professional(专业版2018.2.1)最简单方法破解,亲测有效(转)
  10. Android Studio Gradle下载慢解决方法
  11. 【数据分析与科学计算可视化】numpy 和 matplotlib库总结
  12. linux 安装环境
  13. 数据抓取软件火车采集器如何导入TXT 、EXCEL数据
  14. linux双网卡配置两个ip,centos双线双ip配置,Windows双网卡双ip配置
  15. 2017.9.26 noip模拟赛 总结
  16. Win11封杀盗版office!不用找新密钥,这200套全行业终极模板够你用一辈子,一会儿删...
  17. 第十三天-Http-GET、POST
  18. 懒懒的周末 (r8笔记第30天)
  19. android个人记账本的实验报告,(会计登记账簿实验报告.doc
  20. 大数据平台架构与原型实现-读书笔记8

热门文章

  1. 三菱PLC MC协议简析
  2. 四轴飞控软件开发计划
  3. IIS 配置 FTP 网站
  4. 史上最简单的Spring Security教程(八):用户登出成功LogoutSuccessHandler高级用法
  5. ubuntu中总是提示无法获得锁 (资源暂时不可用) 进程被占用 解决办法
  6. 使用Word公式编辑器
  7. [unity3d]场景烘焙
  8. Altium Designer 去除负片死铜的方法
  9. 【HTML操作指南】
  10. 一文让你学会flex布局关于主轴 、侧轴的布局方式