html显示百度热搜,Python获取百度热搜的完整代码
好久没写了,就把上课做的一个小东西拿出来分享一下吧。
百度网页截图如下 ↓↓↓
程序运行输出结果截图 ↓↓↓
上代码 ↓↓↓
from lxml import etree
from lxml import html
import requests
headers={'User-Agent':'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.63 Safari/537.36'}
page = requests.get("https://www.baidu.com",headers=headers)
html = page.text
#print(source1)
# 从字符串解析
element = etree.HTML(html)
# 元素列表,获取的方式列出了如下两种
# ps = element.xpath('//*[@id="hotsearch-content-wrapper"]/li/a/span[2]')
ps = element.xpath('//*[@class="title-content-title"]')
#热搜文本内容
text = []
if len(ps) > 0:
for p in ps:
#输出节点的文本
text1 = p.text
text.append(text1)
else:
print("空")
x = element.xpath('//*[@class="s-hotsearch-content"]/li')
#热搜文本对应的排名
index = []
for x1 in x:
#获取节点的属性
index1 = x1.get("data-index")
index.append(index1)
print(text)
print(index)
#定义一个对文本和排名进行匹配的函数,返回一个字典型数据
def PP(index_array,text_array):
x = {}
i = 0
for index_a in index_array:
#index_a = int(index_a)
x[index_a] = text_array[i]
i = i + 1
return x
re_text = PP(index,text)
#对字典性数据按key进行排序,即key=lambda re:re[0],排序完成后再转换为字典型数据
last_text = dict(sorted(re_text.items(),key=lambda re:re[0]))
到此这篇关于Python获取百度热搜的完整代码的文章就介绍到这了,更多相关Python 百度热搜内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!
html显示百度热搜,Python获取百度热搜的完整代码相关推荐
- php获取微博热搜,Python获取微博热搜的方法
原标题:Python获取微博热搜的方法 微博热搜的爬取需要用到lxml和requests两个库 url=https://s.weibo.com/top/summary?Refer=top_hot&am ...
- python模拟百度搜索点击链接_用 Python 获取百度搜索结果链接
前言 近期有许多项目需要这个功能,由于Python实现起来比较简单就这么做了,代码贴下来觉得好点个赞吧~ 代码 # coding: utf-8 import os import time import ...
- Python实现网页截图,附带完整代码
Python实现网页截图,附带完整代码 在现代化的互联网时代,我们经常需要对网页进行截图以便于保存.共享以及其他种种用途.Python是一种功能强大的编程语言,可以帮助我们轻松地实现网页截图功能.本文 ...
- 求助:用Python获取百度云服务access_token总是失败
我是个纯小白...纯纯的那种 想试用百度云服务的图片清晰度增强功能,就自己研究.用Python获取access_token总是失败.代码是直接复制的百度的示例代码+自己的AK和SK: # encodi ...
- python经纬度 县信息_10分钟教你用Python获取百度地图各点的经纬度信息
前言 Python确实是个好东西,可以用来解决很多数据上的烦恼.结合现在各个平台提供的API,可以用Python做很多有用的需求哦~ 需求分析 之前写论文的时候,就有这个需求了.就是抓取百度地图上某些 ...
- 10分钟教你用Python获取百度地图各点的经纬度信息
前言 Python确实是个好东西,可以用来解决很多数据上的烦恼.结合现在各个平台提供的API,可以用Python做很多有用的需求哦~ 需求分析 之前写论文的时候,就有这个需求了.就是抓取百度地图上某些 ...
- python seo百度_python与seo,python获取百度360
在百度输入关键词搜索出现的列表页,大约2013年开始点击目标链接,跳转的时候是百度地址,经过百度解析,才真的跳到目标页面.360相对简单很多,利用python略微处理就可以得到搜索结果的真实URL链接 ...
- python 获取百度地图上北京地铁的数据,然后excel导出
今天有人叫我写一下怎样获取百度上地铁的站的名字和线路的代码,我顺手写了一下,这里分享一下我的过程: import requests import jsonimport pandas as pd# ur ...
- php 百度来路关键词,php获取百度搜索关键词的方法[方法过时了]
本来是想找一段通过js获取百度关键词的方法的,结果找并且测试获取到是可以就是只能获取到英文字符,如果是汉字就会乱码!知道可能是转码的问题,使用之前用过的代码也出现这样的问题!刚好看到php获取搜索关键 ...
- 百度域名解析API+python实现百度云DDNS功能绑定动态公网ip
背景:前段时间,朋友为了使用NAS服务,开通了电信的动态公网IP,也就是那种公网IP地址会定期变化,重启光猫也会导致IP变化,朋友的水星低端路由器支持花生壳DDNS,去花生壳官网申请服务后能够正常使用 ...
最新文章
- 【连载】物联网全栈教程-从云端到设备(十三)---安装单片机编译环境
- 如何判断应用已经安装,如何判断Service,BroastCastReceiver,ContentProvider是否存在...
- Webbots、Spiders和Screen Scrapers:技术解析与应用实践(原书第2版)
- 智能指针的释放_看完这篇,别再说不会智能指针了
- 怎么开启队友无伤_王者荣耀:张飞辅助怎么玩才厉害?出装、打法,为你全面解析...
- Linux系统管理(10)——Centos8 重启网络服务 网络相关命令
- 自学python单片机编程-作为一个硬件工程师,你该学学Python了
- ASP.NET MVC+EF框架+EasyUI实现权限管理系列(8)-DbSession线程内唯一
- xp无法访问文件共享服务器,XP不能访问Windows7共享文件之解决办法
- 一般描绘性形容词_英语中描绘性形容词是指哪种形容词?
- axure 鼠标样式_Axure菜单导航怎么添加鼠标选中变色的特效?
- 大白菜备份还原linux,大白菜pe手动gho镜像还原,大白菜制作ghost镜像
- greenplum数据导入导出
- 2021年西安交通大学915研究生考试编程题真题
- 攻防世界-MISC-摩斯电码
- slotformatcombinations_向未授权频谱中的小区应用时隙格式指示的方法和设备与流程...
- Power Query 系列 (01) - Power Query 介绍
- 投简历的邮件正文要写一些什么内容比较恰当
- [开发技巧]·TopN指标计算方法
- 学习linux的网站