python get请求 由于目标机器_使用python和selenium进行Web抓取:由于目标机器主动拒绝i...
我知道这个错误已经被讨论了很多,但似乎每种情况都有不同的原因。
我使用下面的代码和selenium从一个网站提取一些数据,并在第二次调用浏览器.get(url)。在import openpyxl, os
from selenium import webdriver
os.chdir('C://Users/user/Documents')
os.makedirs('GenBank Data', exist_ok = True)
book = openpyxl.load_workbook('Squirrel list 50 percent genus.xlsx')
sheet = book.active
dirs = 'C://Users/user/Documents/GenBank Data'
os.chdir(dirs)
browser = webdriver.Chrome(executable_path = 'C://Users/user/chromedriver.exe',
service_args = ['--ignore-ssl-errors=true', '--ssl-protocol=TLSv1'])
start_col = 7
end_col = 9
start_row = 2
end_row = 160
url_root = 'https://www.ncbi.nlm.nih.gov/nuccore/'
url_end = '.1?report=fasta'
for y in range(start_col, end_col + 1):
file = open(sheet.cell(row = 1, column = y).value, 'w')
for x in range(start_row, end_row + 1):
accession = sheet.cell(row = x, column = y).value
if accession:
print(accession)
url = url_root + accession + url_end
browser.get(url)
data = browser.find_element_by_tag_name('pre')
file.write(data.text + '\n' + '\n')
browser.quit()
file.close()
我使用自己的机器,对服务器和端口的知识有限,这似乎是类似问题答案的重点。任何帮助都将不胜感激。
我已经复制了下面的回溯。在
^{pr2}$
python get请求 由于目标机器_使用python和selenium进行Web抓取:由于目标机器主动拒绝i...相关推荐
- python lxml使用_使用lxml和Python进行Web抓取的简介
python lxml使用 by Timber.io 由Timber.io 使用lxml和Python进行Web抓取的简介 (An Intro to Web Scraping with lxml an ...
- python的web抓取_使用Python进行web抓取的新手指南
Python部落(python.freelycode.com)组织翻译,禁止转载,欢迎转发. 使用基本的Python工具获得一些实践经验,以获取完整的HTML站点. 图片来源 : Jason Bake ...
- python爬虫数据分析项目 双十一_基于Python爬取京东双十一商品价格曲线
一年一度的双十一就快到了,各种砍价.盖楼.挖现金的口令将在未来一个月内充斥朋友圈.微信群中.玩过多次双十一活动的小编表示一顿操作猛如虎,一看结果2毛5.浪费时间不说而且未必得到真正的优惠,双十一电商的 ...
- scrapy 搜索关键字_解析搜索引擎抓取网站目标关键词原理
一个网站有几百甚至几千个关键词,怎么让搜索引擎知道网站的目标关键词是什么呢? 解析搜索引擎抓取网站目标关键词原理 一.网站标题(Title),网站标题是搜索引擎最重视的部分,通常情况下,无论网站是否存 ...
- python 爬虫动态网页的区别_Python开发爬虫之动态网页抓取篇:爬取博客评论数据——通过Selenium模拟浏览器抓取...
区别于上篇动态网页抓取,这里介绍另一种方法,即使用浏览器渲染引擎.直接用浏览器在显示网页时解析 HTML.应用 CSS 样式并执行 JavaScript 的语句. 这个方法在爬虫过程中会打开一个浏览器 ...
- 如何用 Python 实现 Web 抓取?
[编者按]本文作者为 Blog Bowl 联合创始人 Shaumik Daityari,主要介绍 Web 抓取技术的基本实现原理和方法.文章系国内 ITOM 管理平台 OneAPM 编译呈现,以下为正 ...
- [Python从零到壹] 四.网络爬虫之入门基础及正则表达式抓取博客案例
欢迎大家来到"Python从零到壹",在这里我将分享约200篇Python系列文章,带大家一起去学习和玩耍,看看Python这个有趣的世界.所有文章都将结合案例.代码和作者的经验讲 ...
- c#使用正则表达式获取TR中的多个TD_[Python从零到壹] 四.网络爬虫之入门基础及正则表达式抓取博客案例...
首先祝大家中秋节和国庆节快乐,欢迎大家来到"Python从零到壹",在这里我将分享约200篇Python系列文章,带大家一起去学习和玩耍,看看Python这个有趣的世界.所有文章都 ...
- 独家 | 手把手教你用Python进行Web抓取(附代码)
作者:Kerry Parker 翻译:田晓宁 校对:丁楠雅 本文约2900字,建议阅读10分钟. 本教程以在Fast Track上收集百强公司的数据为例,教你抓取网页信息. 作为一名数据科学家,我在工 ...
最新文章
- 2015 Multi-University Training Contest 1 - 1002 Assignment
- Android新手入门2016(10)--GridView
- 每日一题(49)—— 有符号数与无符号数
- 数据分析技术 使用SQL和EXCEL工具 第2版 pdf
- eclipse工具中使用Data Source Explorer连接数据库(MySQL)
- 图像处理之调整对比度
- 三菱FX系列PLC连接触摸屏及组态软件以太网通信方案
- java微信下载word文件怎么打开方式_微信打不开word文档的解决方法 如何打开word文档...
- 死党教会我的编程”记忆大法“,安排!不看可别后悔
- linux之etc/fstab配置文件
- 毫米波雷达器件ADC原始数据捕获
- Opencv计算机视觉入门——图像的处理(一)
- JavaWEB-04 项目案例(1)
- 概率分布、概率密度、概率函数、分布函数之间区别
- 兄弟hl3150cdn打印测试页6_打印性能测试:LED高效输出_兄弟 3150CDN_办公打印评测试用-中关村在线...
- kafka消息过期时间设置(全局和特定topic)
- 微原实验二 数码转换
- html个人博客网站模板(源码)
- [点云补全]-Point Cloud Completion by Skip-attention Network with Hierarchical Folding
- 2011-3-8用友.net笔试面试
热门文章
- C#日期格式精确到毫秒 !!
- Java基于Quartz的定时任务调度服务(一)
- 计数排序之python
- JS导出PDF插件(支持中文、图片使用路径)
- 【C#公共帮助类】10年代码,最全的系统帮助类
- 《机电传动控制》学习笔记03-1
- 20160203.CCPP体系详解(0013天)
- 计算机基础办公软件应用技能,计算机一级计算机基础及 ms office 应用考些什么...
- usaco Preface Numbering 序言页码
- steam自建服务器游戏_虽有差评销量却还是直步青云,《Atlas》力登Steam榜单前茅...