python 爬关键词,Python爬虫实战:爬取微博热搜关键词
一、爬取微博热搜关键词需要的第三方库
1、requests
2、BeautifulSoup 美味汤
3、worldcloud 词云
4、jieba 中文分词
5、matplotlib 绘图
二、爬取微博热搜关键词代码示例import requests
import wordcloud
import jieba
from bs4 import BeautifulSoup
from matplotlib import pyplot as plt
from pylab import mpl
#设置字体
mpl.rcParams['font.sans-serif'] = ['SimHei']
mpl.rcParams['axes.unicode_minus'] = False
url = 'https://s.weibo.com/top/summary?Refer=top_hot&topnav=1&wvr=6'
try:
#获取数据
r = requests.get(url)
r.raise_for_status()
r.encoding = r.apparent_encoding
soup = BeautifulSoup(r.text,'html.parser')
data = soup.find_all('a')
d_list = []
for item in data:
d_list.append(item.text)
words = d_list[4:-11:]
#中文分词
result = list(jieba.cut(words[0]))
for word in words[1::]:
result.extend(jieba.cut(word))
redata = []
for it in result:
if len(it) <= 1:
continue
else:
redata.append(it)
result_str = ' '.join(redata)
#输出词云图
font = r'C:\Windows\Fonts\simhei.ttf'
w = wordcloud.WordCloud(font_path=font,width=600,height=400)
w.generate(result_str)
w.to_file('微博热搜关键词词云.png')
key = list(set(redata))
x,y = [],[]
#筛选数据
for st in key:
count = redata.count(st)
if count <= 1:
continue
else:
x.append(st)
y.append(count)
x.sort()
y.sort()
#绘制结果图
plt.plot(x,y)
plt.show()
except Exception as e:
print(e)
以上就是Python爬虫爬取微博热搜关键词的代码示例,大家可以套入代码直接使用哦~更多python爬虫推荐:python爬虫教程。
python 爬关键词,Python爬虫实战:爬取微博热搜关键词相关推荐
- python 爬虫热搜_Python网络爬虫之爬取微博热搜
微博热搜的爬取较为简单,我只是用了lxml和requests两个库 1.分析网页的源代码:右键--查看网页源代码. 从网页代码中可以获取到信息 (1)热搜的名字都在 的子节点里 (2)热搜的排名都在 ...
- python爬取微博热搜并存入表格_python爬虫进阶之爬取微博热搜存入Mysql
在编程中,我们如果想要把数据转入数据库中,首先会选择 MySQL数据库.因为MySQL数据库体积小.速度快.总体拥有成本低.开放源代码,其有着广泛的应用,例如我们使用python爬虫微博热搜,就可以使 ...
- python爬虫微博热搜_Python网络爬虫之爬取微博热搜
微博热搜的爬取较为简单,我只是用了lxml和requests两个库 url= https://s.weibo.com/top/summary?Refer=top_hot&topnav=1&am ...
- Python爬虫之四:使用BeautifulSoup爬取微博热搜
(一)安装BeautifulSoup模块 目前,Beautiful Soup 的最新版本是 4.x 版本,之前的版本已经停止开发了.这里推荐使用 pip 来安装,安装命令如下: pip install ...
- python爬取微博热搜榜
python爬取微博热搜榜 最近应我大学室友得需求,做了一个简单的爬虫案例,先给大家看一下程序运行效果 接下来就是贴出代码了,在这里我会做一些简单说明,对如刚入门的同学可能会有所帮助,这里使用的是py ...
- Python爬取微博热搜数据之炫酷可视化
可视化展示 看完记得点个赞哟 微博炫酷可视化音乐组合版来了! 项目介绍 背景 现阶段,微博.抖音.快手.哗哩哗哩.微信公众号已经成为不少年轻人必备的"生活神器".在21世纪的今天, ...
- python不间断爬取微博热搜并存储
Q:想要记录实时的微博热搜分析某一类事件的热度怎么办? A: 采用python爬虫24小时不间断爬取微博热搜并存储到本地. 代码如下: # -*- coding: utf-8 -*- "&q ...
- python爬取微博热搜数据并保存!
主要用到requests和bf4两个库将获得的信息保存在d://hotsearch.txt下importrequests;importbs4mylist=[]r=requests.get(ur- 很多 ...
- python爬取微博热搜榜教程,python爬取微博热搜并存入表格
微博热搜的爬取较为简单,我只是用了lxml和requests两个库 url= https://s.weibo.com/top/summary?Refer=top_hot&topnav=1&am ...
最新文章
- ceph osd 相关命令
- Mysql 水平拆分和垂直拆分
- 求职淡季成功跳槽大厂,他做对了这一件事!
- spi iic和串口的区别_GMII、SGMII和SerDes的区别和联系
- 实现当UILable的内容超出其范围后自动滚动效果
- nginx运行php如何,ThinkPHP项目在Nginx上运行的配置问题
- linux安装xgboost快速高效方法
- vue脚手架怎么用mysql_vue.cli脚手架初次使用图文教程
- 如何在CSDN上发gif - 超简单版本
- Java Jna调用Dll动态库函数读写IC卡
- pdf需要简体中文语言支持包_收集全网最好用的PDF转Word工具,赶快收藏起来!...
- 过程装备安装调试技术实训装置QY-GCKZ04
- Stream.of()用法示例
- MATLAB绘制二元函数图像
- FinClip11月产品更新:FIDE 插件开发功能优化;文档中心捉“虫”竞赛火热开启
- 基于产生式规则的动物识别系统(Python)
- java静态变量、静态方法、代码块、main方法
- [Python] RSS 文字转图片并单独抓取url以文字输出
- 我给了老公3个月的花心期!爱还会再回来吗?
- 微信语音短消息amr文件转WAV
热门文章
- java 判断是否是list_JAVA从头开始一基础梳理(4-3)
- java流读取字符串_javaIO之字符流是怎么读取的?
- mysql proxy 主从_【MYSQL知识必知必会】MySQL主从复制读写分离(基于mysql-proxy实现)...
- 瘦子的肠道菌群和胖子的区别_瘦子和病态肥胖患者肠道菌群组成和潜在功能的显著差异...
- ruby 生成哈希值_哈希 Ruby中的运算符
- 河南招教考试计算机专业知识,河南教师招聘考试《计算机网络技术基础》知识点归纳七...
- express 项目生成器_用于项目的Express模板生成器(2)| 应用程序结构研究
- java enummap_Java EnumMap values()方法与示例
- ruby hash添加数据_如何在Ruby中向Hash添加元素?
- Java ObjectInputStream readDouble()方法与示例