小说爬虫强制绕过ssl验证

requests.get(url,verify=False)

verify=False 忽略证书验证

import requests
# 取消忽略ssl的验证警告
import urllib3
urllib3.disable_warnings()from lxml import etree
from multiprocessing.dummy import Pool####获取网页信息####
def get_dow(url):ip = {}headers = {'user-agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.80 Safari/537.36'}req = requests.get(url,headers=headers,proxies=ip,verify=False)req.encoding = 'gbk'soup = etree.HTML(req.text)return (soup)####多线程下载章节####
def cache_download(url):dictname = url[-13:-5]chapter_url = prefix+urlsoup = get_dow(chapter_url)content_name = soup.xpath('//*[@class="bookname"]/h1/text()')[0]content_text = soup.xpath('//*[@id="content"]/text()')content_text = ''.join(content_text)dict[dictname] = [content_name,content_text]print(content_name)####顺序合并多线程下载章节####
def cache_text(url):dictname = url[-13:-5]content_name = dict[dictname][0]content_text = dict[dictname][1]with open(name+'.txt','a',encoding='utf-8') as f:f.write(content_name+'\n')f.write(content_text+'\n')####开始####
if __name__ == '__main__':print('仅支持:https://www.45zw.la/'+'\n')dict = {}a = input('输入要下载的链接码:')target='https://www.45zw.la/txt/'+a+'/'prefix = 'https://www.45zw.la/txt/'+a+'/'soup = get_dow(target)chapter_url_list = soup.xpath('//*[@id="list"]/dl/dd/a/@href')name = str(soup.xpath('//*[@id="info"]/h1/text()')[0])print('\n'+'你须要下载的小说是:'+name+'\n')chapter_unm  = int(input('请输入开始章节:')) +11thread = int(input('\n'+'要启动多少线程下载:'))pool = Pool(thread)pool.map(cache_download,chapter_url_list[chapter_unm:])pool.close()pool.join()pool = Pool(1)pool.imap(cache_text,chapter_url_list[chapter_unm:])pool.close()pool.join()print('\n'+'....下载完成....')

小说爬虫强制绕过ssl验证相关推荐

  1. php curl无视ssl,用Curl实现Post和Get请求,可绕过SSL验证

    今天撸码用到了Curl的post和get请求并需要绕过SSL验证,现将代码打包以备后用: function request_by_curl($url, $post_data = '', $timeou ...

  2. 爬虫代理及ssl验证

    IP代理:import requests url='https://weibo.com/' proxies={ 'http':'116.196.66.197:99999' } # 此处的proxies ...

  3. 关于HttpClient绕过SSL认证以及NTLM认证

    前言 本篇文章只涉及本人在工作上使用HttpClient遇到的情况,并不会详细地展开讲如何使用HttpClient. 1. 为什么使用HttpClient? 一开始其实是考虑使用RestTemplat ...

  4. 绕过安卓SSL验证证书的四种方式

    在此之前,移动端应用程序会直接忽略掉所有的SSL错误,并允许攻击者拦截和修改自己的通信流量.但是现在,很多热门应用程序至少会检查证书链是否是一个有效可信任的证书机构(CA)颁发的. 作为一名渗透测试人 ...

  5. 绕过安卓SSL验证证书的常见四种方式

    在此之前,移动端应用程序会直接忽略掉所有的SSL错误,并允许攻击者拦截和修改自己的通信流量.但是现在,很多热门应用程序至少会检查证书链是否是一个有效可信任的证书机构(CA)颁发的.作为一名渗透测试人员 ...

  6. 绕过安卓SSL验证的办法

    为什么我们要特别关注移动端应用程序的SSL MitM安全情况呢?为了观察或对移动端应用程序的Web服务调用情况,我们需要使用类似BurpSuite或ZAP这样的拦截代理.当我们利用代理拦截下SSL流量 ...

  7. VeriSign扩展验证EV SSL证书——128位强制型SSL服务器证书(VeriSign Secure Site Pro with EV)...

    VeriSign扩展验证EV SSL证书--128位强制型SSL服务器证书(VeriSign Secure Site Pro with EV) • 全球最为知名的SSL证书品牌 • SGC128位强制 ...

  8. 【起点阅读】java小说爬虫

    [起点阅读]java小说爬虫 写一个可以在起点网站爬小说的爬虫 缺点就是vip无法完整的爬取 废话不多说,上代码了] pom.xml 完整各种包的引用 <parent><groupI ...

  9. Python selenium自动化刷问卷+绕过智能验证

      学校思政实践要收集1500份问卷,待在家里无聊就简单写了个用selenium模块实现的自动填写问卷xing问卷的小程序.   基本思路很简单:   1.先打开问卷的网址,按F12进开发者模式分析页 ...

最新文章

  1. 使用Gradle第一次构建Web应用
  2. Caused by SSLError(“Can‘t connect to HTTPS URL because the SSL module is not available)
  3. 【转】Android应用开发allowBackup敏感信息泄露的一点反思
  4. SQLPLUS命令使用大全
  5. laya 怎么生成签名_PHP开发API接口签名生成及验证
  6. Python、C++ lambda 表达式
  7. c# oldb连接_(转)C#连接OleDBConnection数据库的操作
  8. 9月20日云栖精选夜读 | 如何轻松搞定数据科学面试:Python&R语言篇
  9. context:component-scan标签的use-default-filters属性的作用以及原理分析
  10. www计算机会议影响力
  11. java tfidf_Hanlp分词实例:Java实现TFIDF算法
  12. AVC、HEVC、VVC帧间预测技术
  13. UI自动化测试---针对C#项目使用Visual studio CodedUI框架
  14. 如何养狗完整版 !-为了迎接我的大宝做好准备
  15. 服务器的server2016系统怎么装,windowsserver2016安装桌面教程
  16. Cesium PolygonGeometry的移动、拉伸、旋转——拉伸
  17. 巴旦木即将成为农业的下一个“风口”河南巴旦木生态农业:值得期待
  18. 2004年11月1号了
  19. java lambda表达式 list转string
  20. asp计算机房预约系统源码,(机房)实验室预约管理系统

热门文章

  1. RayFire 3D爆炸碎裂效果制作插件(中文序列号激活版下载)
  2. java in.available_如何解决错误java.io.IOException:串行通信的nativeavailable输入/输出错误?...
  3. 世界十大健康食品和十大垃圾食品
  4. 无线技术分类与应用场景
  5. python下wordpdf转换总结
  6. 3网络营销-网络营销调研
  7. Linux之FTP文件自动上传
  8. TRIZ创新方法——物理矛盾及其解决原理
  9. cytoscape网络图2D转3D插件cy3d
  10. 通过LABVIEW控制安川伺服制作的座椅实验室数据采集系统