【Python】爬虫实例——爬取新闻并实现语音播报

本文涉及:
1、爬虫请求链接
2、文字转语音(TTS语音合成技术)

安装:
pip install pyttsx3
pip install requests

根据对搜狗主页 https://www.sogou.com/ 的页面进行的审查元素分析,可知在鼠标在第一次点击搜索框后会加载页面获取新闻内容


可以得到页面链接

可以看到https://www.sogou.com/suggnew/hotwords 返回新闻内容 ,参数v=1612276209757是一个时间戳,我们在用小工具对此时间戳进行验证,证实猜测是正确的

得到了我们的目标url就可以请求爬取了

import time
import pyttsx3
import requestsheaders = {'Accept': '*/*','Accept-Language': 'zh-CN,zh;q=0.9','Connection': 'keep-alive','Referer': 'https://www.sogou.com/','Sec-Fetch-Dest': 'script','Sec-Fetch-Mode': 'no-cors','Sec-Fetch-Site': 'same-origin','User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/106.0.0.0 Safari/537.36','sec-ch-ua': '"Chromium";v="106", "Google Chrome";v="106", "Not;A=Brand";v="99"','sec-ch-ua-mobile': '?0','sec-ch-ua-platform': '"macOS"',
}params = (('v', int(time.time() * 1000)),
)response = requests.get('https://www.sogou.com/suggnew/hotwords', headers=headers, params=params)
news_encode = response.text.encode().decode('unicode-escape').replace("var sogou_top_words=[", '').replace("]",'').replace('"', '').split(',')
speak = pyttsx3.init()  # 语音合成初始化对象
for index, new in enumerate(news_encode):print(f"{index + 1} {new}")speak.say(str(index + 1))  # 要说的内容time.sleep(0.5)speak.say(new)  # 要说的内容speak.runAndWait()  # 循环至语音结束

运行结果如图:
我们使用pytts3语音合成库,在打印每一条新闻的时候进行语音播报

【Python】爬虫实例——爬取新闻并实现语音播报相关推荐

  1. AJAX教程美食滤镜,Python爬虫实例——爬取美团美食数据

    1.分析美团美食网页的url参数构成 1)搜索要点 美团美食,地址:北京,搜索关键词:火锅 2)爬取的url https://bj.meituan.com/s/%E7%81%AB%E9%94%85/ ...

  2. 爬虫python 新闻,Python爬虫实例--爬取人民网新闻

    其实我只是因为在那边评论区想评论,然后发现位置不够,所以才打算写这个博客的,然后具体的可以看我转载的文章,很详细,我这边只说一下关于txt转换为JSON格式的问题 第一次写,格式可能很乱,见谅一下 话 ...

  3. Python爬虫实例-爬取豆瓣电影Top250

    这是本人Python爬虫实例的第二个实例,不过想来好像没有很大的难度所以适合当做新手入门的第一个爬虫.放在这里供大家参考. 本次实例爬取的网站为豆瓣电影Top250,使用到的第三方库有urllib,B ...

  4. python爬虫scrapy爬取新闻标题及链接_python爬虫框架scrapy爬取梅花网资讯信息

    原标题:python爬虫框架scrapy爬取梅花网资讯信息 一.介绍 本例子用scrapy-splash爬取梅花网(http://www.meihua.info/a/list/today)的资讯信息, ...

  5. python爬虫scrapy爬取新闻标题及链接_18Python爬虫---CrawlSpider自动爬取新浪新闻网页标题和链接...

    一.爬取新浪新闻思路 1.创建scrapy项目 2.分析新浪新闻网站静态页面代码 3.编写对应的xpath公式 4.写代码 二.项目代码 步骤1.创建scrapy项目 scrapy startproj ...

  6. Python 爬虫实例+爬取豆瓣小组 + wordcloud 制作词云图

    目标 利用PYTHON爬取如下图中所有回答的内容,并且制作词云图. 用到的库 import requests # import jsonfrom PIL import Image from pyque ...

  7. python爬虫实例--爬取电脑壁纸

    目录 前言 一.用到的工具 二.爬取步骤与过程 1.用到的库 2.解析代码 三.最后上全部的代码啦 最后感悟 前言 听说好的编程习惯是从写文章敲代码开始的,下面给大家介绍一个简单的python爬取图片 ...

  8. (转)python爬虫实例——爬取智联招聘信息

    受友人所托,写了一个爬取智联招聘信息的爬虫,与大家分享. 本文将介绍如何实现该爬虫. 目录 网页分析 实现代码分析 结果 总结 github代码地址 网页分析 以https://xiaoyuan.zh ...

  9. python爬虫实例——爬取智联招聘信息

    受友人所托,写了一个爬取智联招聘信息的爬虫,与大家分享. 本文将介绍如何实现该爬虫. 目录 网页分析 实现代码分析 结果 总结 github代码地址 网页分析 以https://xiaoyuan.zh ...

最新文章

  1. Docker核心原理之namespace
  2. NPM酷库:dateformat 时间字符串格式化
  3. 单片机小白学步系列(一) 单片机的前世今生
  4. emoji .png_根据我对3.5GB聊天记录的分析,Emoji开发人员使用最多
  5. 一文快速探索视频用户网络画像与应用
  6. 添加C1WPFChart快捷键
  7. 全志F1C100s入坑与填坑 uboot Linux Kernel 与buildroot
  8. 使用n切换node版本
  9. 我最喜欢的10个顶级数据科学资源,kaggle、TDS、arXiv......
  10. div p、divp、div+p、div~p、div.a 、p,span的用法和区别
  11. OpenLayers 3实践与原理探究3-ol3一个完整的例子
  12. python武器代码_武器代码总结大全 BO开启秘籍的方法
  13. 盖茨和李嘉诚双龙卸甲 他们的区块链业务一个在链圈扶贫 一个在币圈赚钱
  14. weblogic12.1.3applySession在系统修改阶段失败。。。(GDR-70005)
  15. 鼠标点击添加动态类名active
  16. 能ping通ip却不能ping通域名
  17. GoogleNet、AleXNet、VGGNet、ResNet等总结
  18. Mldonkey的配置
  19. 北大igem生物计算机,喜讯|北京大学iGEM团队在国际大赛中取得金牌
  20. 用虚数做计算机代码,小E教你们如何用计算机算虚数

热门文章

  1. 12、SM2椭圆曲线公钥密码算法
  2. 萃取精馏实验装置,特殊精馏过程与液液萃取分离QY-HGGY39
  3. SolidWorks2015入门到精通视频教程 全20集百度网盘
  4. 局部与断层解剖学复习题
  5. [附源码]SSM计算机毕业设计同德佳苑物业管理系统论文JAVA
  6. AD9中怎么建立多个部分的组成的单个器件
  7. [EOS源码分析]4.EOS源码调试
  8. 5e一直连接不上服务器,5E掉线了了一直连不上服务器是怎么回事?求给个解释...
  9. 基于51单片机的指纹密码锁设计
  10. 设置gvim中横竖光标_vim注释和光标高亮行列的颜色设置