import requests
from lxml import etree
import time
class Book():
def init(self):
self.url = “http://www.qingshu.so/lmqs.html”
self.headers = {
“User-Agent”: “Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.114 Safari/537.36”
}

def get_data(self):response = requests.get(url=self.url, headers=self.headers)response.encoding = "utf-8"return response.text
def parse(self,data):tree = etree.HTML(data)mainlist = tree.xpath('//div[@class="item"]')fp = open("./烂漫情书.txt", "w", encoding='UTF-8')for main in mainlist:mainsrc="http://www.qingshu.so"+ str(main.xpath('.//div[@class="des"]//@href ')[0])# http://www.qingshu.so/aiqing/1669.htmlres=requests.get(mainsrc,headers=self.headers)res.encoding="utf-8"res_text=res.texttree1=etree.HTML(res_text)h1=tree1.xpath('//h1[@class="a_title"]/a/text()')[0]# print(h1)p1=tree1.xpath('//div[@class="a_content clearfix"]//text()')[0]fp.write(str(h1)+"\n"+str(p1)+'\n')print(h1,"下载成功")

if name == ‘main’:
book=Book()
data=book.get_data()
book.parse(data)

python来一份情书采集 备用python xpath相关推荐

  1. 用python写情书_资深Python程序员用图片隐写术写情书,全公司只有她能看懂,绝了...

    谁说程序员不浪漫!他从事python工作七八年,为了追公司的女同事,竟然用python的图片隐写术在图片上写情书,让全公司只有她才能看懂. image 先介绍一下图片隐写术吧,这是一门有关于将信息隐藏 ...

  2. 用python写情书_用Python给喜欢人的发一封邮件吧(群发)

    你好,我是goldsunC 让我们一起进步吧! 利用Python发送邮件 相信我们每个人都用过邮箱,虽然其它社交聊天软件已经非常普及,并且这些社交软件大多都具有文件发送的功能,但很多时候我们仍然离不开 ...

  3. 用python写情书_Fedora写给Python的情书

    运维开发网 https://www.qedev.com 2021-01-16 09:35 出处:51CTO作者:mb5ff590c45613d Fedora写给Python的情书诗书塞外Python程 ...

  4. Ubuntu系统下python opencv视频采集:使用USB端口映射指定要读取的相机设备

    Ubuntu16.04 下 python opencv 视频采集:使用USB端口映射指定要读取的相机设备 有时我们需要读取指定设备的视频流,但笔记本电脑通常自带相机,同时可能连接多个USB相机,每次插 ...

  5. Python网络爬虫开发实战使用XPath,xpath的多种用法

    XPath,全称XML Path Language,即XML路径语言,它是一门在XML文档中查找信息的语言.它最初是用来搜寻XML文档的,但是它同样适用于HTML文档的搜索. 很多人学习python, ...

  6. python网络爬虫系列教程——python中lxml库应用全解(xpath表达式)

    全栈工程师开发手册 (作者:栾鹏) python教程全解 python网络爬虫lxml库的应用全解. 在线安装方法:cmd中输入"pip install lxml" 离线安装,下载 ...

  7. Python 爬虫找到数据了 re XPath requests Pool

    Python 爬虫找到数据了 re & XPath & requests & Pool 2018.06.16 23:18 88浏览 字号 是的,爬虫就是为了获取数据.在获取的数 ...

  8. 小白学 Python 爬虫(20):Xpath 进阶

    人生苦短,我用 Python 前文传送门: 小白学 Python 爬虫(1):开篇 小白学 Python 爬虫(2):前置准备(一)基本类库的安装 小白学 Python 爬虫(3):前置准备(二)Li ...

  9. python金融分析小知识(12)——python爬虫工具xpath使用

    Hello 大家好,我是一名新来的金融领域打工人,日常分享一些python知识,都是自己在学习生活中遇到的一些问题,分享给大家,希望对大家有一定的帮助! 本篇文章紧接上一篇文章,python金融分析小 ...

最新文章

  1. 设置子节点相对于父节点水平竖直都居中
  2. 【bzoj1965】 [Ahoi2005]SHUFFLE 洗牌 欧拉定理
  3. 数据结构(一)---顺序表的实现---java版
  4. java 日期及别的小技巧
  5. canvas特效代码详解(2)
  6. Grpc Proto To Nuget Package 插件使用说明
  7. python的web可视化_Python的Web可视化框架Dash(8)---核心组件
  8. python程序中想使用正则表达式_如何在python中使用正则表达式提取每行中需要的信息...
  9. 精度提升第一步:形状各异测区的像控点布设方案
  10. 生成.properties文件(bat文件生成)
  11. linux文件IO的操作
  12. 2018手机用户体验的11个设计趋势
  13. 后浪说不,是时代的进步
  14. python 车牌识别简单_如何用 Python 识别车牌
  15. 【水果识别】基于matlab GUI阈值分类器草莓识别【含Matlab源码 653期】
  16. 业界资讯: Flash Player Incubator 改进
  17. 测绘摄影测量与遥感乙级资质申请流程及具体要求
  18. Puppet自动化Nginx+Mongrel负载均衡配置
  19. 康考迪亚大学应用计算机科学,康考迪亚大学计算机
  20. php直接读取csv文件,php怎么读取csv文件?

热门文章

  1. 目前最全DDOS攻击方式及防御措施,不看你就亏了!
  2. 可空类型NullableT小结
  3. 2018高教社杯B题 RGV动态调度 c++模拟
  4. 阿里云混合云开放网络生态的探索与实践
  5. ppt转换成pdf转换器哪款比较好
  6. 四足机器人——机械结构
  7. Android11(RK3568)自定义服务制作(2)-Service制作
  8. 红色大气响应式圣诞节节日主题网站模板
  9. 华为手机的便签怎么拷贝到别的手机?
  10. Java获取客户端(浏览器)的MAC地址