python通过urllib+requests来抓取CCTV每日新闻联播的新闻标题

直接上代码

import re
import urllib3
import requests
from bs4 import BeautifulSouprequests.packages.urllib3.disable_warnings()
# 一个PoolManager实例来生成请求, 由该实例对象处理与线程池的连接以及线程安全的所有细节
http = urllib3.PoolManager()
# 通过request()方法创建一个请求:
header = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.108 Safari/537.36'}#cctv网址
r = http.request('GET','https://tv.cctv.com/lm/xwlb/',headers=header)
soup = BeautifulSoup(r.data.decode(), 'html.parser')
item = soup.find(id="content")
str=item.find_all('a',href=re.compile("tv.cctv"))
for str1 in str:print (str1.text)

python通过urllib+request抓取新闻联播相关推荐

  1. Python语言程序设计之urllib.request抓取页面,网易公开课之《麻省理工学院公开课:算法导论》

    Python语言用urllib.request模块抓取页面非常简单,再将抓取的页面内容用re模块解析,找出自己想要的东西.下面就就此方法来抓取网易公开课之<麻省理工学院公开课:算法导论>, ...

  2. python beautifulsoup抓取网页内容_利用Python和Beautiful Soup抓取网页内容

    利用Python和Beautiful Soup抓取网页内容 Posted on 2012-08-09 00:08 SamWei 阅读(381) 评论(1) 编辑 收藏 Python 3中提供了url打 ...

  3. python中模拟浏览器抓取网页(-)

    对于平时我们抓取网页的内容时,比较倾向于直接利用urllib进行抓取(这里我就基于python的2.7版本进行解说,对于python3之后的版本,是将python中的urllib和urllib2和并成 ...

  4. python爬取百度贴吧中的所有邮箱_使用 Python 编写多线程爬虫抓取百度贴吧邮箱与手机号...

    原标题:使用 Python 编写多线程爬虫抓取百度贴吧邮箱与手机号 不知道大家过年都是怎么过的,反正栏主是在家睡了一天,醒来的时候登QQ发现有人找我要一份贴吧爬虫的源代码,想起之前练手的时候写过一个抓 ...

  5. python爬虫代码房-Python爬虫一步步抓取房产信息

    原标题:Python爬虫一步步抓取房产信息 前言 嗯,这一篇文章更多是想分享一下我的网页分析方法.玩爬虫也快有一年了,基本代码熟悉之后,我感觉写一个爬虫最有意思的莫过于研究其网页背后的加载过程了,也就 ...

  6. Python爬虫项目:抓取智联招聘信息

    来自https://mp.weixin.qq.com/s/0SzLGqv2p0-IWSN3r8bOHA ''' Python爬虫之五:抓取智联招聘基础版 该文件运行后会产生一个代码,保存在这个Pyth ...

  7. Python3-Spyder-urllib.request抓取搜haohuo平台信息-保存到csv

    *Python3-Spyder-urllib.request抓取搜haohuo平台信息-保存到csv -- coding: utf-8 -- """ Created on ...

  8. Python进阶之Scrapy抓取苏宁图书数据

    Python进阶之Scrapy抓取苏宁图书数据 1. 需求 2. 代码示例: 创建项目 start.py settings.py iterms.py snb.py pipelines.py 3. 注意 ...

  9. jupyter分割代码块_科研分享—Python根据关键词自动抓取Pubmed文献标题(附全部代码)文末有福利...

    写在前面:接触Python应该是8月初的一篇公众号文章,大致内容是使用py爬取数据库并汇总到本地.正好手头需要对某个领域的文献进行调研,不妨学习一下. 什么是Python? 百度说:Python (计 ...

最新文章

  1. 如何使用TensorFlow Eager执行训练自己的FaceID ConvNet
  2. 厦大诚招青年AI科学家:待遇不一般,连配偶和子女教育都考虑到了
  3. HDOJ/HDU 2566 统计硬币(公式~遍历~)
  4. JavaScript响应键盘不再用KeyboardEvent.keyCode,而是用keyboardEvent.code
  5. Python+Appium+POM实现APP端自动化测试
  6. c语言 年月日比较大小
  7. 世界坐标系到观察坐标系的变换步骤_带你轻松认识不同坐标系下向量的“变脸”——基变换...
  8. M1 Max 暴击,倚天补刀
  9. SQL分割字符串详解
  10. 结构体03:结构体指针
  11. 强制 Google.com 域名使用 HTTPS(SSL)
  12. 极速office(Word)如何插入分数
  13. 「镁客早报」詹克团、吴忌寒或将卸任比特大陆CEO;特斯拉任命两位新独立董事... 1
  14. 从0到一开发微信小程序(2)——开发第一个小程序
  15. Python 安装theano tensorflow keras 教程与pip安装失败解决方法
  16. Java输出PPT文件(二) - 占位符数据替换
  17. “独享宽带”是什么意思?
  18. 拉勾 python_python 登录拉钩
  19. Xxe漏洞 php,PhpSpreadsheet 1.5.0 XXE漏洞复现及分析
  20. 19届毕业生在字节跳动工作的真实体验!

热门文章

  1. 计算机不同的账户桌面一样吗,我们不一样,每个人的电脑桌面都有不同的境遇...
  2. 记录unity制作2D游戏过程
  3. 米软科技单病种质量管理智能上报系统之版本区分
  4. java获取项目中的路径_通过java获取当前项目路径
  5. php 心跳检测,Swoole 实例四(心跳检测)
  6. 毕业论文的结构及要求
  7. Python的匿名函数
  8. 使用ZXing实现二维码扫描
  9. 第16章 局部波动率模型——对冲比率及奇异期权估值
  10. A-Level经济真题(10)