简介

通过百度指数,以及python的baidux模块和 flourish 制作可视化动态图表,实现数据的可视化。

安装baidux模块

打开pycharm 输入以下命令

pip install baidux

用法

打开百度指数,登录后,找到index.html此条 GET 请求,并复制此条请求 headers 里的 cookies,注意复制完全!使用样例如下:

from baidux.utils import test_cookies
from baidux import config
from baidux import BaiduIndex, ExtendedBaiduIndexcookies = """这里放cookie"""# 测试cookies是否配置正确
# True为配置成功,False为配置不成功
print(test_cookies(cookies))keywords = [['英雄联盟'], ['冠军杯', '英雄联盟'], ['抑郁', '自杀', '明星']]# 获取城市代码, 将代码传入area可以获取不同城市的指数, 不传则为全国
# 媒体指数不能分地区获取
print(config.PROVINCE_CODE)
print(config.CITY_CODE)# 获取百度搜索指数(地区为山东)
baidu_index = BaiduIndex(keywords=keywords,start_date='2018-01-01',end_date='2019-01-01',cookies=cookies,area=901
)
for index in baidu_index.get_index():print(index)# 获取百度媒体指数
news_index = ExtendedBaiduIndex(keywords=keywords,start_date='2018-01-01',end_date='2019-01-01',cookies=cookies,kind='news'
)
for index in news_index.get_index():print(index)# 获取百度咨询指数
feed_index = ExtendedBaiduIndex(keywords=keywords,start_date='2018-01-01',end_date='2019-01-01',cookies=cookies,kind='feed'
)
for index in feed_index.get_index():print(index)

结果

百度搜索指数: {'keyword': ['抑郁', '自杀', '明星'], 'type': 'wise', 'date': '2018-06-10', 'index': '1835'}
百度媒体指数: {'keyword': ['抑郁', '自杀', '明星'], 'date': '2018-12-29', 'index': '0'}
百度咨询指数: {'keyword': ['抑郁', '自杀', '明星'], 'date': '2018-12-29', 'index': '1102911'}

技巧

如需导出txt文件则 添加以下代码

class Logger(object):
def __init__(self, filename="Default.log"):self.terminal = sys.stdoutself.log = open(filename, "a")def write(self, message):self.terminal.write(message)self.log.write(message)def flush(self):pass
sys.stdout = Logger('文件名称.txt')
for index in baidu_index.get_index():
print(index)
  • 不限制传入关键词的数量
  • 搜索指数最早的数据日期为2011-01-01
  • 开始时间超过最早的数据日期会导致数据不准确
  • 初始化类时传入area可以查询指定区域的百度指数, 默认为全国
  • 有些代码不是特别严谨, 有需要请自己DIY
  • 媒体指数不支持细分地域查询
  • 当查询百度指数未收录的关键词时也会出现报错,这个之后会修复

如需制作可视化动态图表可以访问以下网站
Flourish | Data Visualisation & Storytelling

视频教程在这儿:一分钟制作百度指数可视化图表_哔哩哔哩_bilibili

调入数据以后 即生成动态图表啦。

Python百度指数抓取 一键生成指数信息导出到txt文件,制作可视化动态图表相关推荐

  1. python爬关键词百度指数_详解python3百度指数抓取实例

    百度指数抓取,再用图像识别得到指数 前言: 土福曾说,百度指数很难抓,在淘宝上面是20块1个关键字: 哥那么叼的人怎么会被他吓到,于是乎花了零零碎碎加起来大约2天半搞定,在此鄙视一下土福 安装的库很多 ...

  2. 【Python爬虫】百度指数爬取+导入数据库+QuickBI展示

    百度指数爬取原文在这里:如何用Python下载百度指数的数据_小小明-代码实体的专栏-CSDN博客 00.序言 一直想把百度指数每天定时爬下来,然后放到Dashboard里展示,终于,我看到了大神给出 ...

  3. java 抓取百度新闻,java中使用jdom生成百度新闻抓取的xm

    百度新闻开放,详细见 plaincopy to clipboardprint? 自己用java写了个使用jdom生成百度要求的 xml文件 的实例,生成供百度搜索引擎抓取新闻 package com. ...

  4. python爬虫(抓取百度新闻列表)

    一.python请求要抓取的url页面 要抓取的url http://news.baidu.com/ ,先python模拟请求该url #!/usr/bin/python # -*- coding:u ...

  5. python抓取网页内容到excel_Python实现抓取网页生成Excel文件的方法示例

    本文实例讲述了Python实现抓取网页生成Excel文件的方法.分享给大家供大家参考,具体如下: Python抓网页,主要用到了PyQuery,这个跟jQuery用法一样,超级给力 示例代码如下: # ...

  6. python爬虫微信朋友圈怎么发文字_如何利用Python网络爬虫抓取微信朋友圈的动态(上)...

    今天小编给大家分享一下如何利用Python网络爬虫抓取微信朋友圈的动态信息,实际上如果单独的去爬取朋友圈的话,难度会非常大,因为微信没有提供向网易云音乐这样的API接口,所以很容易找不到门.不过不要慌 ...

  7. 机械臂论文笔记(一)【基于卷积神经网络的二指机械手 抓取姿态生成研究 】

    基于卷积神经网络的二指机械手 抓取姿态生成研究 论文下载 摘要 第1章 绪论 1.1 抓取生成国内外研究现状 1.1.1已知物体抓取生成 1.1.2相似物体抓取生成 1.1.3 未知物体抓取生成 1. ...

  8. python抓取微信朋友圈动态_2018最全如何利用Python网络爬虫抓取微信朋友圈的动态...

    今天小编给大家分享一下如何利用Python网络爬虫抓取微信朋友圈的动态信息,实际上如果单独的去爬取朋友圈的话,难度会非常大,因为微信没有提供向网易云音乐这样的API接口,所以很容易找不到门.不过不要慌 ...

  9. Python爬虫:抓取智联招聘岗位信息和要求(进阶版)

    本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理 以下文章来源于腾讯云 作者:王强 ( 想要学习Python?Python学习交流群 ...

  10. Python 3.6 抓取微博m站数据

    Python 3.6 抓取微博m站数据 2019.05.01 更新内容 containerid 可以通过 "107603" + user_id 组装得到,无需请求个人信息获取: 优 ...

最新文章

  1. 之江汇空间如何加音乐背景_从脚本到成品,教你如何快速制作出创意又浪漫的婚礼视频...
  2. 为何高并发系统中都要使用消息队列
  3. dtm文件生成等高线 lisp_DEM、DSM和DTM的区别
  4. 洛谷 - P1989 无向图三元环计数(思维建图)
  5. 下列可以产生斜体字的html标签是,电子科技大学《网页设计与制作》20秋期末考试题目【标准答案】...
  6. python信用卡违约预测分析_Python数据分析及可视化实例之银行信用卡违约预测(24)...
  7. python全局变量的声明和使用_python自学篇(第三章:函数)
  8. pdfdom将pdf转成html,使用pdfdom将pdf转为html(示例代码)
  9. 苹果台式机怎么设置我的电脑计算机,台式苹果电脑自己怎样做系统
  10. 极米旗舰级新品极米H5强势来袭:画质性能在线,硬核配置拉满
  11. AI算法模型线上部署方法总结
  12. 淘宝宝贝商家编码 管理好你的宝贝
  13. linux ps1 主机名 ip,Bash Shell PS1: 自定义你的linux提示符十例
  14. 【uniapp】使用扫码插件,解决uni.scanCode扫码效率低的问题
  15. 计算机网络实验rdt实验
  16. 全新Java开发思维导图
  17. 什么是RabbitMQ RabbitMQ详解
  18. 离线数仓0点漂移问题解决:使用拦截器解决0点漂移问题
  19. dell服务器怎么用u盘系统安装win7系统教程,解答戴尔怎么使用u盘重装win7系统
  20. 一个小老板的日常管理,希望能让创业朋友学到东西

热门文章

  1. 微博营销的优劣势。如何利用微博开展营销。
  2. 微信客服消息群发 php,利用客服消息和模板消息实现微信群发(突破群发接口的上限)...
  3. 解决虚拟机中桥接模式下ip地址的设置
  4. rk3399 aarch64 arm64 使用英特尔神经计算棒openvino
  5. 乡下人生活录——程序员给自己买份保险吧
  6. 如何安装.ipa文件
  7. Qt之QTreeWidget增删节点
  8. 多多客id是什么意思_拼多多skuid是什么意思(关于sku编码的详细介绍)
  9. 阿里巴巴程序员常用的 15 款开发者工具!你知道几个?
  10. 作品交流:锁相环环路滤波器系数、NCO增益单位、鉴相器输出之间的关系