#!/usr/bin/env python
# -*- coding:utf-8 -*-#爬虫,搜索热点排行
import urllib.request
import urllib
import re
import json
import xlwt
import os#获取网站首页全部内容
cnt = 50 #只能1-50
url = 'https://zhidao.baidu.com/question/api/hotword?rn='+cnt.__str__()+'&t=1535421904906'
print(url)
user_agent = 'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.6) Gecko/20091201 Firefox/3.5.6'
req = urllib.request.Request(url, headers={'User-Agent': user_agent})
response = urllib.request.urlopen(req)
content = response.read().decode('utf-8')
#print(content)workbook = xlwt.Workbook()
sheet1 = workbook.add_sheet('sheet1',cell_overwrite_ok=True)sheet1.write(0,0,'排名')
sheet1.write(0,1,'新闻名称')
sheet1.write(0,2,'搜索人数')
sheet1.write(0,3,'变化数量')
sheet1.write(0,4,'新的新闻')
sheet1.write(0,5,'热度上升')dataList = json.loads(content)['data']
j = 1
for data in dataList:print(data)sheet1.write(j, 0,j)sheet1.write(j, 1,data['keyword'])sheet1.write(j, 2, data['searches'])sheet1.write(j, 3, data['changeRate'])isNew = data['isNew'];if isNew==0:isNew = '否'elif isNew==1:isNew = '是'sheet1.write(j, 4, isNew.__str__())trend = data['trend']style5 = xlwt.XFStyle()font = xlwt.Font()style5.font = fontif trend == 'fall':font.colour_index = 3trend = '下降'elif trend == 'rise':font.colour_index = 2trend = '上升'sheet1.write(j, 5, trend,style5)j = j + 1#保存该excel文件,有同名文件时直接覆盖
path = 'D:\\Python'
if not os.path.isdir(path):os.makedirs(path)
paths = path + '\\'
filename = 'test1'
workbook.save('{}{}.xls'.format(paths,filename))
print('创建excel文件完成!')

  百度时候总能看到热搜排行,以上代码就是爬虫获取排行

转载于:https://www.cnblogs.com/Monster-World/p/9547199.html

爬虫,百度搜索热点排行相关推荐

  1. 仿百度搜索热点列表的实现

    相信大家都用过百度搜索,其中在百度搜索结果的右侧会有一个搜索热点的列表. 这个搜索列表中有一个换一换的链接,当我们点击这个链接的时候列表就会更换一次.其实这个交互的实现效果非常的简单. html代码如 ...

  2. 开发一个chrome插件:将百度搜索热点屏蔽掉!

       每次百度搜索,搜索结果的右边总是出现些乱七八糟的搜索热点(推的都是些什么玩意,高校替课和我有毛关系,几个悲伤的热点我用星号顶掉了).   强迫症想把它隐藏掉,我用的是chrome浏览器,受adb ...

  3. 如何关闭百度搜索热点

    1.关闭搜索热点 在adblock plus的过滤列表中添加: www.baidu.com##div[tpl="right_toplist"] 2.关闭右侧内容 在adblock ...

  4. SEO概念:(例如百度搜索竞价排行)

    (自用,侵权删) *制定seo标准 使网站编码和内容呈现方式易于被抓取,如果有看到不妥的地方,必须制止并引导其走向正确的方式: *向编辑人员灌输seo理念 要求其撰写原创.优质的内容,独特而优质的内容 ...

  5. 如何屏蔽百度热搜榜?(关闭百度搜索热点、关闭百度风云榜实时热点)(Adblock Plus插件)

    这种百度热搜榜,每天只要一打开网页就看到,看起来就很恶心很烦很影响心情有木有?

  6. Python爬虫百度搜索

    一.bs4实现 import requests from urllib import parse from bs4 import BeautifulSoup import timeheaders={ ...

  7. 教你如何屏蔽 烦人的百度 搜索热点

    下载 https://adblockplus.org/zh_CN/download 开源代码 https://github.com/adblockplus 没法科学上网的 源码编译 https://g ...

  8. 跟我一起屏蔽百度搜索页面右侧的内容

    苦恼百度搜索热点等冗杂信息很久了,然后今天下定决心解决这个问题了. 第一步:搜索,并安装插件Adblock Plus 第二步:使用拦截器 1.打开拦截器 2.具体使用 点击这一块 添加 转载于:htt ...

  9. python爬取热门新闻每日排行_用python查看百度搜索中今日热点事件排行榜

    大家好,我是咿哑呀.我们知道,在百度搜索中,查看今日热点事件排行榜时,可以打开网址"http://top.baidu.com/buzz?b=341&c=513&fr=topb ...

最新文章

  1. 如何从Docker容器内部连接到计算机的本地主机?
  2. 前端三十二:超链接(a标签)
  3. 【详细注解】1020 Tree Traversals (25 分)
  4. 如何在TypeScript中使用JS类库
  5. 如何从零开始开发一个 Chrome 插件?
  6. 在c++中qsort()排序函数的使用qsort函数应用大全
  7. docker部署redis集群_Docker部署Redis集群----第九节(docker-redis哨兵集群“轮询分流”篇实例一)...
  8. linux系统MVS安装,Ubuntu 环境 openMVG+openMVS 配置
  9. 2018 年,新手前端是否真的很难找工作?
  10. GDB使用gdb-stl-views打印STL容器元素
  11. 西门子S7系列中间人攻击:防御和流量异常检测(三)
  12. QCalendarWidget 日历控件
  13. Java解压压缩包(zip/rar/7z)
  14. python基础教程虎课-想配一台PS修图的电脑,请大家推荐配置? | ps修图基础
  15. 爬取斗鱼主播名字和热度
  16. 【大数据技术详解】搭建redis集群服务的步骤和配置以及解决创建集群时会遇到的错误:NodeX replied with error:ERRInvalid node address specified
  17. Java的foreach中,变量加final的作用(for(final XXX xxx : xxxs))
  18. QQ2010去除迷你首页O(∩_∩)O
  19. JDBC占位符的使用
  20. .netCHARTING报表图表控件详细介绍

热门文章

  1. 身份证号判断性别和地区
  2. 《数学之美》PPT配套讲稿
  3. 怎么实现EDIUS底屏游走字幕的制作
  4. vue 导出excel兼容IE用blob的形式
  5. 【Android工具】安卓TV云存储观影工具测试正常,安卓电视看电影方案小结
  6. 用odin刷三星note 2成功
  7. 树莓派之禁用自动黑屏休眠模式
  8. PC上一款非常好用的PDF阅读器,支持免费格式转换、支持云端同步
  9. 我爱机器学习 机器学习干货站- 资源
  10. 小米8原生android10,小米8SE 魔趣OS 安卓10 MagiskV21版 完美ROOT 纯净完美 原生极简 纯净推荐...