#!/usr/local/bin/python3.7
# -*- coding: utf-8 -*-
# @Time: 2019/07/15
# @Function 获取在线文本内容import requests
from bs4 import BeautifulSoup
import re
import codecsurl = 'https://www.shuhaige.com/7518/'
header = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.140 Safari/537.36','Origin': 'https://www.shuhaige.com','Host': 'www.shuhaige.com'
}
# 设置代理服务器
proxies = {'http:': 'http://121.232.146.184','https:': 'https://144.255.48.197'
}def getContent():contents = requests.get(url, headers=header).texthtml = BeautifulSoup(contents, 'html.parser')lists = html.select('dl')[0].select('a')for list in lists:itemUrl = f'https://www.shuhaige.com{list["href"]}'itemContent = requests.get(itemUrl, headers=header).textitemHtml = BeautifulSoup(itemContent, 'html.parser')saveToTxt(itemHtml.select('div .content')[0], list.string)# 写入文本文件
def saveToTxt(comments, title):commentsList = ''for item in comments:comment_info = f'{item}'.replace(f'<br/>', '')comment_info = re.sub(f'<p>.*</p>', '', comment_info)commentsList += comment_infowith codecs.open(f'MoFeiDingLv/{title}.txt', 'w', encoding='utf-8') as file:file.writelines(commentsList)print(f'{title}写入文件成功!')getContent()

  书本内容来自 书海阁《墨菲定律》

转载于:https://www.cnblogs.com/Man-Dream-Necessary/p/11193415.html

python3.7爬取墨菲定律保存在本地txt相关推荐

  1. python3.7保存_python3.7爬取墨菲定律保存在本地txt

    #!/usr/local/bin/python3.7 # -*- coding: utf-8 -*- # @Time: 2019/07/15 # @Function 获取在线文本内容 import r ...

  2. Python爬取起点小说并保存到本地文件夹和MongoDB数据库中

    Python爬取起点小说并保存到本地MongoDB数据库中 工具:Python3.7 + Mongo4.0 + Pycharm """ 爬取起点小说<诡秘之主> ...

  3. Python 爬取网页信息并保存到本地爬虫爬取网页第一步【简单易懂,注释超级全,代码可以直接运行】

    Python 爬取网页信息并保存到本地[简单易懂,代码可以直接运行] 功能:给出一个关键词,根据关键词爬取程序,这是爬虫爬取网页的第一步 步骤: 1.确定url 2.确定请求头 3.发送请求 4.写入 ...

  4. node.js 爬虫 实现爬取网页图片并保存到本地

    node.js 爬虫 实现爬取网页图片并保存到本地 没有废话直接看代码 /*** 请求网站数据* 将数据保存本地文件*/ //不同协议引用不同模块,http https const http = re ...

  5. java爬取网页并保存_第九讲:Python爬取网页图片并保存到本地

    上一讲我们说了如何把网页的数据通过分析后存储到数据库,我们这次讲如何将网页上的图片提取并下载到本地. 思路如下: 我们本次要爬取的是昵图网首页的图片. 1.首先分析我们要爬取的网页的代码结构,每个网页 ...

  6. 第九讲:Python爬取网页图片并保存到本地

    上一讲我们说了如何把网页的数据通过分析后存储到数据库,我们这次讲如何将网页上的图片提取并下载到本地. 思路如下: 我们本次要爬取的是昵图网首页的图片. 1.首先分析我们要爬取的网页的代码结构,每个网页 ...

  7. python爬取一张图片并保存_python爬取网页图片并保存到本地

    先把原理梳理一下:首先我们要爬取网页的代码,然后从中提取图片的地址,通过获取到的地址来下载数据,并保存在文件中,完成. 下面是具体步骤: 先确定目标,我挑选的是国服守望先锋的官网的英雄页面,我的目标是 ...

  8. python爬取一张图片并保存_第九讲:Python爬取网页图片并保存到本地

    上一讲我们说了如何把网页的数据通过分析后存储到数据库,我们这次讲如何将网页上的图片提取并下载到本地. 思路如下: 我们本次要爬取的是昵图网首页的图片. 1.首先分析我们要爬取的网页的代码结构,每个网页 ...

  9. 爬取网站图片并保存到本地

    第一步:模拟浏览器发出请求,获取网页数据 import requests# 目标网站 url = 'https://baijiahao.baidu.com/s?id=16872785093955534 ...

  10. python3自动爬取网页资源并保存为epub电子书

    使用Python获取网页内容并生成EPUB格式电子书 前言 EPUB的介绍 思路 代码示例 前言 现在的有很多电子书都不能下载了,只能在线看,但是广告又多.所以想编个程序抓取这些内容生成电子书. EP ...

最新文章

  1. 前端学习(2785):实现导航的基本结构
  2. C# GDI+绘图介绍
  3. GMF 教程 Mindmap 6
  4. Spring学习总结(1)- IOC
  5. ASP.net+MVC--2
  6. 政府数据泄漏频现 美国能源部也未幸免
  7. APACHE ACTIVEMQ安装
  8. PCL Examples
  9. 【三石jQuery视频教程】01.图片循环展示
  10. PowerDesigner 逆向工程 Could not Initialize JavaVM!
  11. 论“无常,苦、无我”
  12. python正版软件多少钱_正版数据库软件需要多少钱
  13. iOS keyChain 研究
  14. python爬虫爬取豆瓣电影信息城市_Python爬虫入门 | 2 爬取豆瓣电影信息
  15. 虚拟地址到物理地址的转换步骤
  16. frp代理工具流量分析
  17. 禁止win7系统flash插件自动更新教程【系统天地】
  18. Java代码审计基础——RMI原理和反序列化利用链
  19. 展开w ndows文件很慢,(Wndows优化大师的功能和使用方法分析.doc
  20. 智慧警务三维电子沙盘系统

热门文章

  1. Android调试萤石云摄像头时,出现400036错误
  2. 无人机倾斜摄影三维建模技术在智慧城市中的应用
  3. mbedtls 自带SSL demo调试
  4. Mysql8.0安装步骤
  5. 新手必看:PS软件入门基础知识
  6. 使用VC++6.0创建.cpp文件工程
  7. jquery 鼠标按住移动的解决方案
  8. 2寸的照片长宽各是多少_两寸照片多少厘米?2寸免冠照片尺寸是多少?2寸免冠照片长宽多少?...
  9. 计算机一级添加通讯录好友,电脑企业微信从微信好友中添加成员功能如何使用...
  10. 一些好看的渐变色(配色)网站推荐