python pyquery 解析html数据(2)

1、PHP实现:php解析html类库simple_html_dom(2)

2、python 执行效果

3、python代码

from pyquery import PyQuery as pq#自定义一段HTML
def getHtml():html =  "<html>" \"<head>" \"<title>大家好</title>" \"</head>" \"<body>" \"<!-- 文章START -->" \"<div class='whole'>" \"" \"<!-- 标题START -->" \"<div class='head'>" \"<h2>美好的一天</h2>" \"<div>" \"<span>御风剑士</span>" \"<span>2019-04-24</span>" \"</div>" \"</div>" \"<!-- 标题SEND -->" \"" \"<!-- 内容START -->" \"<div class='content'>" \"<a href='http://www.***.com'>" \"<img src='http://images.***.com'/>" \"</a>" \"<div class='info'>" \"回来的时候换了一条路。那里进过广场的公园。一如既往的有好多手机贴膜的小贩还有只有一个板凳面前一张纸卖电话卡的小贩。" \"</div>" \"<div class='info'>" \"我看见石榴花开了,红的黄的真的特别的好看。月季依然开得很娇艳。" \"</div>" \"<div class='info'>" \"因为昨夜下雨的原因吗,感觉空气好新鲜,身心愉悦脚步也很轻快。尽管没有太阳,但是我知道,今天又是美好的一天,也是生命中最年轻的一天。" \"</div>" \"</div>" \"<!-- 内容END -->" \"" \"<div>" \"<!-- 文章END -->" \"</body>" \"</html>"return html#k开始执行
html = getHtml()    #获取HTML内容
d = pq(html)        #加载HTML内容#获取最外面的div whole
articleObj = d.find('body div.whole')#定位到div.whole里的标题
title = articleObj.find('div.head h2').text()#获取作者、时间
author = articleObj.find('div.head div span').eq(0).text() #索引为0,同级div标签下的第1个span
time = articleObj.find('div.head div span').eq(1).text()   #索引为0,同级div标签下的第1个span#或者用items()获取到数组然后循环出来也行
"""
authTimeArr = []
authTime = articleObj.find('div.head div span').items()
for value in authTime:authTimeArr.append(value.text())
author = authTimeArr[0]
time = authTimeArr[1]
"""#获取div.content内容里的数据
contentObj = articleObj.find('div.content')#a链接,图片 我们要获取的是标签上的 href 属性
aHref = contentObj.find('a').attr('href')#图片路径,获取img标签的src属性
imgSrc = contentObj.find('a img').attr('src')#三段话,获取到P标签数组,然后循环获取P标签的内容
pContent = ''
for val in contentObj.find('div.info').items():pContent += val.text()+"\n"print("文章标题-%s\n文章作者-%s\n文章时间-%s\n链接地址-%s\n图片地址-%s\n文字内容-%s"%(title, author,time, aHref, imgSrc, pContent))

python pyquery 解析html数据(2)相关推荐

  1. perl python json_Perl解析JSON数据精解

    简介: JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式. 它基于JavaScript(Standard ECMA-262 3rd Edition - De ...

  2. Python深层解析json数据之JsonPath

    我们在做接口自动化时,一般接口响应的都是json数据体,对响应数据进行提取使用或断言,当数据量很大或层级很深时,就会变得很麻烦,于是就可以用到jsonpath模块,解决json路径深取值难的问题. 一 ...

  3. python html解析_Python HTML解析器

    python html解析 Python html.parser module provides us with the HTMLParser class, which can be sub-clas ...

  4. Python爬虫入门之爬虫解析提取数据的四种方法

    本文主要介绍了Python爬虫入门之爬虫解析提取数据的四种方法,通过具体的内容向大家展现,希望对大家Python爬虫的学习有所帮助. 基础爬虫的固定模式 笔者这里所谈的基础爬虫,指的是不需要处理像异步 ...

  5. python遍历data、并输出结果_获取python运行输出的数据并解析存为dataFrame实例

    在学习xg的 时候,想画学习曲线,但无奈没有没有这个 evals_result_ AttributeError: 'Booster' object has no attribute 'evals_re ...

  6. python为什么closed_为什么Python无法解析此JSON数据? [关闭] - Why can't Python parse this JSON data? [closed]...

    问题: I have this JSON in a file: 我在文件中有此JSON: { "maps": [ { "id": "blabla&qu ...

  7. Python 解析构建数据大杂烩 -- csv、xml、json、excel

    Python 可以通过各种库去解析我们常见的数据.其中 csv 文件以纯文本形式存储表格数据,以某字符作为分隔值,通常为逗号:xml 可拓展标记语言,很像超文本标记语言 Html ,但主要对文档和数据 ...

  8. python爬虫解析数据_Python爬虫入门知识:解析数据篇

    首先,让我们回顾一下入门Python爬虫的四个步骤吧: 而解析数据,其用途就是在爬虫过程中将服务器返回的HTML源代码转换为我们能读懂的格式.那么,接下来就正式进入到解析数据篇的内容啦. Part 1 ...

  9. python 报文解析_python解析DNS数据包实例代码

    例子,python解析DNS数据包. 代码示例: ###file QueryDNS.py## -*- coding: utf-8 -*- #Get DNS answer #详情见RFC 1035 im ...

  10. Python+Open3D 解析Velodyne VLP-16激光雷达数据

    Python+Open3D 解析Velodyne VLP-16激光雷达数据 参数简介 数据包介绍 实际数据介绍 坐标转换关系 补偿半径 运行结果 代码 最近在公司搞了搞激光雷达,把代码写一写. 参数简 ...

最新文章

  1. java 线程通讯_java多线程(五)线程通讯
  2. 苹果谷歌脸书大佬前往游说!欧盟将首次对AI进行监管
  3. java获取系统电量_android操作系统怎么获得电量
  4. java子程序_JAVA-JVM的执行子程序(类加载)
  5. html引入iview如何修改样式,vue中如何修改iView的样式,
  6. 【学习笔记】智能制造之精益思想
  7. 又~发现两篇好文章~~
  8. C++如何选择智能指针
  9. 一些建议:给当年刚做程序员的我
  10. 读《构建之法》第11,12章有感
  11. JMeter事务控制器(Transaction controller)
  12. IJKMediaFramework框架的集成和使用实例一枚
  13. 玩转Java注解:元注解、内置注解、自定义注解的原理和实现
  14. mysql命令导出数据不完整_使用MySQL MySqldump命令导出数据时的注意事项
  15. “sudo: apt-get:找不到命令”的解决方法
  16. 安卓源码下载的环境搭建
  17. 喜马拉雅xm格式转化mp3_强大的视频格式转换工具
  18. 连接共享打印机时提示无法访问计算机,共享打印机无法连接,教您共享打印机无法连接怎么办...
  19. 【立创开源】RY3730-带充电的恒流驱动LED照明灯
  20. html控件透明与背景透明

热门文章

  1. python实验九答案_Python程序设计实验报告:实验九 python 包管理
  2. oracle optimizer_index_cost_adj,OPTIMIZER_INDEX_COST_ADJ与成本计算
  3. sql与MySQL like用法_MySQL中Like概念及用法讲解
  4. oracle 访问adf 慢,ORACLE ADF 问题总结
  5. iphone实用配置工具_除了让你买买买,苹果官网还隐藏着这些实用网页工具
  6. Oracle在线撤销表空间,Oracle创建、管理撤销表空间
  7. python微信聊天机器人_教你用Python创建微信聊天机器人
  8. java awt run_JAVA教程 第五讲 AWT图形用户界面设计(一)
  9. centos 的命令背景能改吗_精装改毛坯,“降价”促销?“以价换量”还能走得通吗?...
  10. truncate表和update 效率_SQL中Truncate的用法