今天遇到一个网页,按往常的老办法

soup = BeautifulSoup(content, 'lxml')

打印soup发现少了很多数据,刚开始还以为反爬,后来经过验证不是。、
那么就是解析问题,我换成了

soup = BeautifulSoup(content, 'xml')

打印发现我想要的那块成功出现了,但是对比整个网页发现,其实还是有一些没有显示出来的,不管他,时间紧任务重,得过且过。
后来进入详情页,发现又显示不全了。中间试了xpath等各种解析手段,还是显示不出来。
最后还是继续使用bs4。

soup = BeautifulSoup(content,'html.parser')

发现又成功解析出来了。

写这篇博客并没有深究为什么会这样,能出来结果就赶紧接着往下做。紧张的工作中,大多数小伙伴应该都是这样。
如果有遇到同样只是解析显示不全问题的小伙伴,试过了我的这几种方法都还是不行,可以去搜bs4的文档,里面有更多的方法,祝你好运

使用Beautifulsoup解析网页遇到的问题相关推荐

  1. 使用BeautifulSoup解析网页时漏掉了元素

    使用 soup=BeautifulSoup(res.text,"html.parser") 解析网页时漏掉了元素 改为 soup=BeautifulSoup(res.text, & ...

  2. Python爬虫自学之第(②)篇——BeautifulSoup解析网页

    题外话: <Pi Network 免费挖矿国外热门项目 一个π币大约值3元到10元>相信过去BTC的人,信不信未来的PI,了解一下,唯一一个高度与之持平的项目 学了requests,了解了 ...

  3. Python开发爬虫之BeautifulSoup解析网页篇:爬取安居客网站上北京二手房数据

    目标:爬取安居客网站上前10页北京二手房的数据,包括二手房源的名称.价格.几室几厅.大小.建造年份.联系人.地址.标签等. 网址为:https://beijing.anjuke.com/sale/ B ...

  4. 头歌Beautifulsoup解析网页

    import requests from bs4 import BeautifulSoup def get_data(url, headers):'''两个参数:param url:统一资源定位符,请 ...

  5. python 安居客 爬虫_Python开发爬虫之BeautifulSoup解析网页篇:爬取安居客网站上北京二手房数据...

    page1 宏星地产租售部 新出!1700南花园, 赠500万红木家具 3800万 106442元/m2 5室2厅 357m2 共3层 2008年建造 夏秋冬 碧水庄园 昌平-沙河-定泗路 ['独栋别 ...

  6. 爬虫学习----解析网页

    解析网页就是从服务器请求下来的网页数据中提取出我们需要的数据,常用的有三种方法:正则表达式解析网页.BeautifulSoup和lxml. 一.使用正则表达式解析网页 正则表达式就是对字符串操作的一种 ...

  7. BeautifulSoup解析爱丽丝梦游仙境网页小练习

    BeautifulSoup解析爱丽丝梦游仙境网页小练习 html_doc = """ <html><head><title>The D ...

  8. 7-13爬虫入门之BeautifulSoup对网页爬取内容的解析

    通过beautifulsoup对json爬取的文件进行元素审查,获取是否含有p标签 # -*- coding:utf-8 -*- from lxml import html import reques ...

  9. beautifulsoup网页爬虫解析_Python爬虫3步曲:5分钟学习用Python解析网页

    使用正则表达式解析网页是Python的一个擅长的领域.如果还想更加深入地学习正则表达式,或者在平时经常用到正则表达式,可以进入Regular Expression 101网站学习,网站地址为 http ...

最新文章

  1. 【紧急】支付宝全面停止微信合作
  2. 《精通Unix下C语言编程与项目实践》目录
  3. python爬虫框架排行榜-Python爬虫框架--pyspider初体验
  4. Vi Command
  5. Google Maps API 进级: GoogleMaps常用事件及应用思路1
  6. 如何用报表解决销售工作衡量问题
  7. android4.0闪光灯亮度控制代码,android 应用开发如何调节闪光灯亮度?
  8. java设计模式工厂模式_Java中的复合设计模式
  9. Latex数学符号输入大全
  10. Introduction to Convex Optimization Basic Concepts 详细
  11. 注册查看隐私协议 --- 滚动条是否滚动到底
  12. 初创企业适用的邮件群发软件
  13. 百度人脸识别之人脸注册AddUser
  14. Android 沉浸式(透明)状态栏细研-超级细还附 Demo
  15. 这么久了,深爱的人,还好吗?
  16. 华为方舟编译器开源官网正式上线,并首次开放了框架源码!
  17. yuv数据(nv12和nv21)和RGB数据之间转换的c++代码
  18. 自学编程容易可行吗?
  19. 鼠标拖曳盒子案例(限定边界)
  20. Java将json字符串转list对象(亲测)

热门文章

  1. HTML播放华为云视频流,华为云点播服务视频管理功能强大,上云就是省心
  2. 2021年度总结,男儿努力平生志
  3. 【CLAA系列】CLAA协议学习(CS方向)
  4. CWNP宣布中国首位CWNE获得者——朱志立(Kevin Zhu)
  5. Activiti6:解决定时器不执行的问题(定时catching事件的使用)
  6. Jlink 烧写文件到 nandflash norflash
  7. JS Turbo空气悬浮鼓风机
  8. 获取当前位置的经度纬度
  9. 【matlab】三次埃尔米特插值与三次样条插值的实际应用代码
  10. 如何在线批量进行PDF拆分