爬虫实例十一 全国城市房价排行
目标网址:
https://www.creprice.cn/rank/index.html
这一看就是个静态页面,没有用任何反爬措施所以很好爬。
直接发送请求解析数据就可以了。
完整代码
import requests
from lxml import etree
import openpyxl#新建workbook对象
wb=openpyxl.Workbook()
#创建正在操作的表
sheet = wb.active
#设置sheet表格的表头
sheet.append(['序号','城市名称','平均单价','环比','同比'])url="https://www.creprice.cn/rank/index.html"
headers={"User-Agent":"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.88 Safari/537.36"
}
html=requests.get(url=url,headers=headers).text
tree=etree.HTML(html)
number=tree.xpath("//tbody[@class='ranklist']/tr/th[1]/text()")[1::]
city_name=tree.xpath("//tbody[@class='ranklist']/tr/th[2]/a/text()")
price=tree.xpath("//tbody[@class='ranklist']/tr/th[3]/text()")[1::]
Hb=tree.xpath("//tbody[@class='ranklist']/tr/th[4]/text()")[1::]
Tb=tree.xpath("//tbody[@class='ranklist']/tr/th[5]/text()")[1::]
for i in range(0,len(city_name)):data = []data.append(number[i])data.append(city_name[i])data.append(price[i])data.append(Hb[i])data.append(Tb[i])print(data)sheet.append(data)
wb.save('房价排行.xlsx')
解析:
进入网站打开开发者工具后我们直接可以看到网页源代码,直接就能请求下来
这基本全是html代码
所以我们首选xpath来解析数据,用正则在这里反而有点麻烦
爬虫实例十一 全国城市房价排行相关推荐
- 2008年6月中国城市房价排行
由 赳客网"宜居城市研究室"统计整理的最新2008年6月中国城市房价排名于6月22日首次在广州香格兰大酒店隆重发布.据举办方 赳客网相关负责人介绍,今后 赳客网将定期统计中国各地城 ...
- 全国php工资城市排名,2019年各城市工资排行_2019年全国各城市最新工资排行出炉 想去哪玩来对...
2019年全国各城市最新工资排行出炉 想去哪玩来对号入座了吧 JPG,326x482,128KB,255_378 全国28城市平均月薪排行榜出炉 天津居倒数第三 JPG,617x1167,231KB, ...
- NO.31——Python爬虫分析马蜂窝十一假期城市旅游数据
十一假期开始,打开朋友圈,看到小伙伴们纷纷晒出了自己的车票,不是出去玩就是回家.因为不可抗拒的因素,可怜的我只能坚守工作岗位,哪都去不了,心急难耐之余,虽然自己去不了,那就看看全国各地的广大旅友都喜欢 ...
- python批量爬取小网格区域坐标系_Python爬虫实例_利用百度地图API批量获取城市所有的POI点...
上篇关于爬虫的文章,我们讲解了如何运用Python的requests及BeautifuiSoup模块来完成静态网页的爬取,总结过程,网页爬虫本质就两步: 1.设置请求参数(url,headers,co ...
- python爬取公交车站数据_Python爬虫实例_城市公交网络站点数据的爬取方法
爬取的站点:http://beijing.8684.cn/ (1)环境配置,直接上代码: # -*- coding: utf-8 -*- import requests ##导入requests fr ...
- Python爬虫学习第三章-4.3-使用xpath解析爬取全国城市名称
Python爬虫学习第三章-4.3-使用xpath解析爬取全国城市名称 这一节主要是使用xpath解析爬取全国城市名称 这里使用的网址是:空气质量历史数据查询 这一个案例体现的点主要是xpat ...
- 一线城市房价集体下跌暗藏啥玄机?
根据国家统计局最新发布的数据,7月份,北京.上海.广州.深圳四个城市的新房价格分别下跌了1.3%.1.4%.1.3%和0.6%:二手房价格环比跌幅则分别为0.8%.0.9%.1.1%和0.6%.从环比 ...
- 网页爬虫实战:全国电动汽车充电站数据
爬虫实战:全国电动汽车充电站数据 项目详情页请访问 Github,喜欢的话就去加个 star 吧 ,附上Github个人博客 先放张效果图,吸引一下眼球 下面进入正题~ 想必大家某些时候总需要爬取一些 ...
- 报告称国内超八成城市房价跌回一年前 北京上海回涨
报告称国内超八成城市房价跌回一年前 北京上海回涨 行业动态中国新闻网[微博]2014-12-01 00:28 我要分享 5 中新网12月1日电 一系列楼市政策利好下的销量回升,并未扭转11月房价的下滑 ...
- 09年中国城市房价排行榜出炉 北京位居第4位
2009年上半年全国百城市房价-收入比排行榜 http://www.cmmr.com.cn/_d269868831.htm 2008年全国337个地级市GDP排名 http://bbs ...
最新文章
- C++走向远洋——39(指向学生类的指针)
- ruby动态new对象
- CAS 服务器端取消 https的配置 方法
- 用VB开发SAP接口程序
- win7中cookie的保存位置
- 走进Windows Server 2008服务器核心(Serve Core)
- bzoj1038 [ZJOI2008]瞭望塔 枚举
- ROS入门 工程结构
- Dart基础-运算符
- 【旧文章搬运】360安全卫士HookPort.sys完美逆向
- 100个WordPress常用插件精选
- Putty密钥(PrivateKey)导入SecureCRT
- 具体数学-第5课(8种方法求和)
- JavaScript基础知识总结(1)
- Linux进程调度器的设计--Linux进程的管理与调度(十七)
- 原来微信“对方正在输入”在这种情况下才显示
- 申请ios开发者证书到获取p12文件及profiles文件
- 计算机与计算机网络_让计算机承担责任
- WCF自定义扩展,以实现aop!
- 网易图灵学院python公开课_图灵学院 Python全系列教程全栈工程师 python视频教程下载...
热门文章
- 图说:Windows 8 Copy的呈现变化
- excel实时获取基金信息的实现方法
- 3.中小型企业通用自动化运维架构 -- Ansible playbook
- 36.session
- 13. PHP 表数据入口(table data gateway)
- 数据结构与算法学习网
- 用.NET编程风格实现Ajax——Atlas快速入门
- Windows系统CVE整理
- 第七届蓝桥杯省赛--四平方和
- 【MAVEN】搜索错误“Index downloads are disabled,search results may be incomplete”