一、爬取微博热搜关键词需要的第三方库

1、requests

2、BeautifulSoup 美味汤

3、worldcloud 词云

4、jieba 中文分词

5、matplotlib 绘图

二、爬取微博热搜关键词代码示例import requests

import wordcloud

import jieba

from bs4 import BeautifulSoup

from matplotlib import pyplot as plt

from pylab import mpl

#设置字体

mpl.rcParams['font.sans-serif'] = ['SimHei']

mpl.rcParams['axes.unicode_minus'] = False

url = 'https://s.weibo.com/top/summary?Refer=top_hot&topnav=1&wvr=6'

try:

#获取数据

r = requests.get(url)

r.raise_for_status()

r.encoding = r.apparent_encoding

soup = BeautifulSoup(r.text,'html.parser')

data = soup.find_all('a')

d_list = []

for item in data:

d_list.append(item.text)

words = d_list[4:-11:]

#中文分词

result = list(jieba.cut(words[0]))

for word in words[1::]:

result.extend(jieba.cut(word))

redata = []

for it in result:

if len(it) <= 1:

continue

else:

redata.append(it)

result_str = ' '.join(redata)

#输出词云图

font = r'C:\Windows\Fonts\simhei.ttf'

w = wordcloud.WordCloud(font_path=font,width=600,height=400)

w.generate(result_str)

w.to_file('微博热搜关键词词云.png')

key = list(set(redata))

x,y = [],[]

#筛选数据

for st in key:

count = redata.count(st)

if count <= 1:

continue

else:

x.append(st)

y.append(count)

x.sort()

y.sort()

#绘制结果图

plt.plot(x,y)

plt.show()

except Exception as e:

print(e)

以上就是Python爬虫爬取微博热搜关键词的代码示例,大家可以套入代码直接使用哦~更多python爬虫推荐:python爬虫教程。

python 爬关键词,Python爬虫实战:爬取微博热搜关键词相关推荐

  1. python 爬虫热搜_Python网络爬虫之爬取微博热搜

    微博热搜的爬取较为简单,我只是用了lxml和requests两个库 1.分析网页的源代码:右键--查看网页源代码. 从网页代码中可以获取到信息 (1)热搜的名字都在 的子节点里 (2)热搜的排名都在 ...

  2. python爬取微博热搜并存入表格_python爬虫进阶之爬取微博热搜存入Mysql

    在编程中,我们如果想要把数据转入数据库中,首先会选择 MySQL数据库.因为MySQL数据库体积小.速度快.总体拥有成本低.开放源代码,其有着广泛的应用,例如我们使用python爬虫微博热搜,就可以使 ...

  3. python爬虫微博热搜_Python网络爬虫之爬取微博热搜

    微博热搜的爬取较为简单,我只是用了lxml和requests两个库 url= https://s.weibo.com/top/summary?Refer=top_hot&topnav=1&am ...

  4. Python爬虫之四:使用BeautifulSoup爬取微博热搜

    (一)安装BeautifulSoup模块 目前,Beautiful Soup 的最新版本是 4.x 版本,之前的版本已经停止开发了.这里推荐使用 pip 来安装,安装命令如下: pip install ...

  5. python爬取微博热搜榜

    python爬取微博热搜榜 最近应我大学室友得需求,做了一个简单的爬虫案例,先给大家看一下程序运行效果 接下来就是贴出代码了,在这里我会做一些简单说明,对如刚入门的同学可能会有所帮助,这里使用的是py ...

  6. Python爬取微博热搜数据之炫酷可视化

    可视化展示 看完记得点个赞哟 微博炫酷可视化音乐组合版来了! 项目介绍 背景 现阶段,微博.抖音.快手.哗哩哗哩.微信公众号已经成为不少年轻人必备的"生活神器".在21世纪的今天, ...

  7. python不间断爬取微博热搜并存储

    Q:想要记录实时的微博热搜分析某一类事件的热度怎么办? A: 采用python爬虫24小时不间断爬取微博热搜并存储到本地. 代码如下: # -*- coding: utf-8 -*- "&q ...

  8. python爬取微博热搜数据并保存!

    主要用到requests和bf4两个库将获得的信息保存在d://hotsearch.txt下importrequests;importbs4mylist=[]r=requests.get(ur- 很多 ...

  9. python爬取微博热搜榜教程,python爬取微博热搜并存入表格

    微博热搜的爬取较为简单,我只是用了lxml和requests两个库 url= https://s.weibo.com/top/summary?Refer=top_hot&topnav=1&am ...

最新文章

  1. ceph osd 相关命令
  2. Mysql 水平拆分和垂直拆分
  3. 求职淡季成功跳槽大厂,他做对了这一件事!
  4. spi iic和串口的区别_GMII、SGMII和SerDes的区别和联系
  5. 实现当UILable的内容超出其范围后自动滚动效果
  6. nginx运行php如何,ThinkPHP项目在Nginx上运行的配置问题
  7. linux安装xgboost快速高效方法
  8. vue脚手架怎么用mysql_vue.cli脚手架初次使用图文教程
  9. 如何在CSDN上发gif - 超简单版本
  10. Java Jna调用Dll动态库函数读写IC卡
  11. pdf需要简体中文语言支持包_收集全网最好用的PDF转Word工具,赶快收藏起来!...
  12. 过程装备安装调试技术实训装置QY-GCKZ04
  13. Stream.of()用法示例
  14. MATLAB绘制二元函数图像
  15. FinClip11月产品更新:FIDE 插件开发功能优化;文档中心捉“虫”竞赛火热开启
  16. 基于产生式规则的动物识别系统(Python)
  17. java静态变量、静态方法、代码块、main方法
  18. [Python] RSS 文字转图片并单独抓取url以文字输出
  19. 我给了老公3个月的花心期!爱还会再回来吗?
  20. 微信语音短消息amr文件转WAV

热门文章

  1. java 判断是否是list_JAVA从头开始一基础梳理(4-3)
  2. java流读取字符串_javaIO之字符流是怎么读取的?
  3. mysql proxy 主从_【MYSQL知识必知必会】MySQL主从复制读写分离(基于mysql-proxy实现)...
  4. 瘦子的肠道菌群和胖子的区别_瘦子和病态肥胖患者肠道菌群组成和潜在功能的显著差异...
  5. ruby 生成哈希值_哈希 Ruby中的运算符
  6. 河南招教考试计算机专业知识,河南教师招聘考试《计算机网络技术基础》知识点归纳七...
  7. express 项目生成器_用于项目的Express模板生成器(2)| 应用程序结构研究
  8. java enummap_Java EnumMap values()方法与示例
  9. ruby hash添加数据_如何在Ruby中向Hash添加元素?
  10. Java ObjectInputStream readDouble()方法与示例