【Python】爬虫实例——爬取新闻并实现语音播报
【Python】爬虫实例——爬取新闻并实现语音播报
本文涉及:
1、爬虫请求链接
2、文字转语音(TTS语音合成技术)
安装:
pip install pyttsx3
pip install requests
根据对搜狗主页 https://www.sogou.com/ 的页面进行的审查元素分析,可知在鼠标在第一次点击搜索框后会加载页面获取新闻内容
可以得到页面链接
可以看到https://www.sogou.com/suggnew/hotwords 返回新闻内容 ,参数v=1612276209757是一个时间戳,我们在用小工具对此时间戳进行验证,证实猜测是正确的
得到了我们的目标url就可以请求爬取了
import time
import pyttsx3
import requestsheaders = {'Accept': '*/*','Accept-Language': 'zh-CN,zh;q=0.9','Connection': 'keep-alive','Referer': 'https://www.sogou.com/','Sec-Fetch-Dest': 'script','Sec-Fetch-Mode': 'no-cors','Sec-Fetch-Site': 'same-origin','User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/106.0.0.0 Safari/537.36','sec-ch-ua': '"Chromium";v="106", "Google Chrome";v="106", "Not;A=Brand";v="99"','sec-ch-ua-mobile': '?0','sec-ch-ua-platform': '"macOS"',
}params = (('v', int(time.time() * 1000)),
)response = requests.get('https://www.sogou.com/suggnew/hotwords', headers=headers, params=params)
news_encode = response.text.encode().decode('unicode-escape').replace("var sogou_top_words=[", '').replace("]",'').replace('"', '').split(',')
speak = pyttsx3.init() # 语音合成初始化对象
for index, new in enumerate(news_encode):print(f"{index + 1} {new}")speak.say(str(index + 1)) # 要说的内容time.sleep(0.5)speak.say(new) # 要说的内容speak.runAndWait() # 循环至语音结束
运行结果如图:
我们使用pytts3语音合成库,在打印每一条新闻的时候进行语音播报
【Python】爬虫实例——爬取新闻并实现语音播报相关推荐
- AJAX教程美食滤镜,Python爬虫实例——爬取美团美食数据
1.分析美团美食网页的url参数构成 1)搜索要点 美团美食,地址:北京,搜索关键词:火锅 2)爬取的url https://bj.meituan.com/s/%E7%81%AB%E9%94%85/ ...
- 爬虫python 新闻,Python爬虫实例--爬取人民网新闻
其实我只是因为在那边评论区想评论,然后发现位置不够,所以才打算写这个博客的,然后具体的可以看我转载的文章,很详细,我这边只说一下关于txt转换为JSON格式的问题 第一次写,格式可能很乱,见谅一下 话 ...
- Python爬虫实例-爬取豆瓣电影Top250
这是本人Python爬虫实例的第二个实例,不过想来好像没有很大的难度所以适合当做新手入门的第一个爬虫.放在这里供大家参考. 本次实例爬取的网站为豆瓣电影Top250,使用到的第三方库有urllib,B ...
- python爬虫scrapy爬取新闻标题及链接_python爬虫框架scrapy爬取梅花网资讯信息
原标题:python爬虫框架scrapy爬取梅花网资讯信息 一.介绍 本例子用scrapy-splash爬取梅花网(http://www.meihua.info/a/list/today)的资讯信息, ...
- python爬虫scrapy爬取新闻标题及链接_18Python爬虫---CrawlSpider自动爬取新浪新闻网页标题和链接...
一.爬取新浪新闻思路 1.创建scrapy项目 2.分析新浪新闻网站静态页面代码 3.编写对应的xpath公式 4.写代码 二.项目代码 步骤1.创建scrapy项目 scrapy startproj ...
- Python 爬虫实例+爬取豆瓣小组 + wordcloud 制作词云图
目标 利用PYTHON爬取如下图中所有回答的内容,并且制作词云图. 用到的库 import requests # import jsonfrom PIL import Image from pyque ...
- python爬虫实例--爬取电脑壁纸
目录 前言 一.用到的工具 二.爬取步骤与过程 1.用到的库 2.解析代码 三.最后上全部的代码啦 最后感悟 前言 听说好的编程习惯是从写文章敲代码开始的,下面给大家介绍一个简单的python爬取图片 ...
- (转)python爬虫实例——爬取智联招聘信息
受友人所托,写了一个爬取智联招聘信息的爬虫,与大家分享. 本文将介绍如何实现该爬虫. 目录 网页分析 实现代码分析 结果 总结 github代码地址 网页分析 以https://xiaoyuan.zh ...
- python爬虫实例——爬取智联招聘信息
受友人所托,写了一个爬取智联招聘信息的爬虫,与大家分享. 本文将介绍如何实现该爬虫. 目录 网页分析 实现代码分析 结果 总结 github代码地址 网页分析 以https://xiaoyuan.zh ...
最新文章
- Docker核心原理之namespace
- NPM酷库:dateformat 时间字符串格式化
- 单片机小白学步系列(一) 单片机的前世今生
- emoji .png_根据我对3.5GB聊天记录的分析,Emoji开发人员使用最多
- 一文快速探索视频用户网络画像与应用
- 添加C1WPFChart快捷键
- 全志F1C100s入坑与填坑 uboot Linux Kernel 与buildroot
- 使用n切换node版本
- 我最喜欢的10个顶级数据科学资源,kaggle、TDS、arXiv......
- div p、divp、div+p、div~p、div.a 、p,span的用法和区别
- OpenLayers 3实践与原理探究3-ol3一个完整的例子
- python武器代码_武器代码总结大全 BO开启秘籍的方法
- 盖茨和李嘉诚双龙卸甲 他们的区块链业务一个在链圈扶贫 一个在币圈赚钱
- weblogic12.1.3applySession在系统修改阶段失败。。。(GDR-70005)
- 鼠标点击添加动态类名active
- 能ping通ip却不能ping通域名
- GoogleNet、AleXNet、VGGNet、ResNet等总结
- Mldonkey的配置
- 北大igem生物计算机,喜讯|北京大学iGEM团队在国际大赛中取得金牌
- 用虚数做计算机代码,小E教你们如何用计算机算虚数
热门文章
- 12、SM2椭圆曲线公钥密码算法
- 萃取精馏实验装置,特殊精馏过程与液液萃取分离QY-HGGY39
- SolidWorks2015入门到精通视频教程 全20集百度网盘
- 局部与断层解剖学复习题
- [附源码]SSM计算机毕业设计同德佳苑物业管理系统论文JAVA
- AD9中怎么建立多个部分的组成的单个器件
- [EOS源码分析]4.EOS源码调试
- 5e一直连接不上服务器,5E掉线了了一直连不上服务器是怎么回事?求给个解释...
- 基于51单片机的指纹密码锁设计
- 设置gvim中横竖光标_vim注释和光标高亮行列的颜色设置