【Python】爬虫实例——爬取新闻并实现语音播报

本文涉及：
1、爬虫请求链接
2、文字转语音(TTS语音合成技术)

安装：
pip install pyttsx3
pip install requests

根据对搜狗主页 https://www.sogou.com/ 的页面进行的审查元素分析，可知在鼠标在第一次点击搜索框后会加载页面获取新闻内容

可以得到页面链接

可以看到https://www.sogou.com/suggnew/hotwords 返回新闻内容，参数v=1612276209757是一个时间戳，我们在用小工具对此时间戳进行验证，证实猜测是正确的

得到了我们的目标url就可以请求爬取了

import time
import pyttsx3
import requestsheaders = {'Accept': '*/*','Accept-Language': 'zh-CN,zh;q=0.9','Connection': 'keep-alive','Referer': 'https://www.sogou.com/','Sec-Fetch-Dest': 'script','Sec-Fetch-Mode': 'no-cors','Sec-Fetch-Site': 'same-origin','User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/106.0.0.0 Safari/537.36','sec-ch-ua': '"Chromium";v="106", "Google Chrome";v="106", "Not;A=Brand";v="99"','sec-ch-ua-mobile': '?0','sec-ch-ua-platform': '"macOS"',
}params = (('v', int(time.time() * 1000)),
)response = requests.get('https://www.sogou.com/suggnew/hotwords', headers=headers, params=params)
news_encode = response.text.encode().decode('unicode-escape').replace("var sogou_top_words=[", '').replace("]",'').replace('"', '').split(',')
speak = pyttsx3.init()  # 语音合成初始化对象
for index, new in enumerate(news_encode):print(f"{index + 1} {new}")speak.say(str(index + 1))  # 要说的内容time.sleep(0.5)speak.say(new)  # 要说的内容speak.runAndWait()  # 循环至语音结束

运行结果如图：
我们使用pytts3语音合成库，在打印每一条新闻的时候进行语音播报

【Python】爬虫实例——爬取新闻并实现语音播报相关推荐

AJAX教程美食滤镜,Python爬虫实例——爬取美团美食数据
1.分析美团美食网页的url参数构成 1)搜索要点美团美食,地址:北京,搜索关键词:火锅 2)爬取的url https://bj.meituan.com/s/%E7%81%AB%E9%94%85/ ...
爬虫python 新闻,Python爬虫实例--爬取人民网新闻
其实我只是因为在那边评论区想评论,然后发现位置不够,所以才打算写这个博客的,然后具体的可以看我转载的文章,很详细,我这边只说一下关于txt转换为JSON格式的问题第一次写,格式可能很乱,见谅一下话 ...
Python爬虫实例-爬取豆瓣电影Top250
这是本人Python爬虫实例的第二个实例,不过想来好像没有很大的难度所以适合当做新手入门的第一个爬虫.放在这里供大家参考. 本次实例爬取的网站为豆瓣电影Top250,使用到的第三方库有urllib,B ...
python爬虫scrapy爬取新闻标题及链接_python爬虫框架scrapy爬取梅花网资讯信息
原标题:python爬虫框架scrapy爬取梅花网资讯信息一.介绍本例子用scrapy-splash爬取梅花网(http://www.meihua.info/a/list/today)的资讯信息, ...
python爬虫scrapy爬取新闻标题及链接_18Python爬虫---CrawlSpider自动爬取新浪新闻网页标题和链接...
一.爬取新浪新闻思路 1.创建scrapy项目 2.分析新浪新闻网站静态页面代码 3.编写对应的xpath公式 4.写代码二.项目代码步骤1.创建scrapy项目 scrapy startproj ...
Python 爬虫实例+爬取豆瓣小组 + wordcloud 制作词云图
目标利用PYTHON爬取如下图中所有回答的内容,并且制作词云图. 用到的库 import requests # import jsonfrom PIL import Image from pyque ...
python爬虫实例--爬取电脑壁纸
目录前言一.用到的工具二.爬取步骤与过程 1.用到的库 2.解析代码三.最后上全部的代码啦最后感悟前言听说好的编程习惯是从写文章敲代码开始的,下面给大家介绍一个简单的python爬取图片 ...
(转)python爬虫实例——爬取智联招聘信息
受友人所托,写了一个爬取智联招聘信息的爬虫,与大家分享. 本文将介绍如何实现该爬虫. 目录网页分析实现代码分析结果总结 github代码地址网页分析以https://xiaoyuan.zh ...
python爬虫实例——爬取智联招聘信息
受友人所托,写了一个爬取智联招聘信息的爬虫,与大家分享. 本文将介绍如何实现该爬虫. 目录网页分析实现代码分析结果总结 github代码地址网页分析以https://xiaoyuan.zh ...

【Python】爬虫实例——爬取新闻并实现语音播报

【Python】爬虫实例——爬取新闻并实现语音播报

【Python】爬虫实例——爬取新闻并实现语音播报相关推荐

最新文章

热门文章