爬取南京链家租房信息
爬取南京链家租房信息
代码如下 代码片
.
import requests
from lxml import etree
if name == “main”:
#设置一个通用URL模板
headers={
‘User-Agent’:‘Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.88 Safari/537.36’
}
url=‘https://nj.lianjia.com/zufang/pg%d’
fp=open(‘lianjia.txt’,‘w’,encoding=‘utf-8’)
for pagenum in range(1,101):
new_url=format(url%pagenum)
page_text=requests.get(url=new_url,headers=headers).text
tree=etree.HTML(page_text)
div_list=tree.xpath(’//div[@class=“content__list”]/div’)
for div in div_list:
title=div.xpath(’./div/p/a/text()’)[0]
price=div.xpath(’./div/span/em/text()’)[0]
print(title+price+“元/月”)
fp.write(title+price+“元/月”)
爬取南京链家租房信息相关推荐
- 爬取广州链家租房信息,并用tableau进行数据分析
在外工作,难免需要租房子,而链家是现在比较火的一个租房网站,本文章主要是爬取链家在广州的租房信息,并且进行简单的数据分析. 数据采集 如图所示,我们需要的信息主要是存放在这个标签里面,我们把信息采集下 ...
- python爬虫--爬取链家租房信息
python 爬虫-链家租房信息 爬虫,其实就是爬取web页面上的信息. 链家租房信息页面如下: https://gz.lianjia.com/zufang/ ## python库 Python库 1 ...
- Python爬虫框架Scrapy入门(三)爬虫实战:爬取长沙链家二手房
Item Pipeline介绍 Item对象是一个简单的容器,用于收集抓取到的数据,其提供了类似于字典(dictionary-like)的API,并具有用于声明可用字段的简单语法. Scrapy的It ...
- 用Python爬取2020链家杭州二手房数据
起源于数据挖掘课程设计的需求,参考着17年这位老兄写的代码:https://blog.csdn.net/sinat_36772813/article/details/73497956?utm_medi ...
- 爬取‘广州链家新房’数据并以csv形式保存。
--本次的目标是爬取'广州链家新房'前十页的信息,具体需要爬取的信息为'楼房名字.地址.价格以及是否在售的情况',具体的代码如下. import requests,time import pandas ...
- Python爬虫入门 | 5 爬取小猪短租租房信息
小猪短租是一个租房网站,上面有很多优质的民宿出租信息,下面我们以成都地区的租房信息为例,来尝试爬取这些数据. 小猪短租(成都)页面:http://cd.xiaozhu.com/ 1.爬取租房标题 ...
- Python疫起学习·万丈高楼平地起Day09(精简版|浓缩就是精华)爬虫知识附上案例爬取北京地区短租房信息、爬取酷狗TOP500的数据以及爬取网易云音乐热歌榜单
爬虫知识 Requests库 部分运行结果如下: 有时爬虫需要加入请求头来伪装成浏览器,以便更好地抓取数据.在Chrome浏览器中按F12键打开Chrome开发者工具,刷新网页后找到User-Agen ...
- 简单python脚本 爬取杭州链家二手房 房价信息
爬取链家房价信息 主要使用以下库: requests BeautifulSoup 相关问题 当爬取次数太多的时候,可能会遇到被封的情况或者验证码, 大佬们可以自行解决,这个脚本里面我就不掺和了,毕竟我 ...
- python爬取网上租房信息_Python爬虫入门 | 5 爬取小猪短租租房信息
小猪短租是一个租房网站,上面有很多优质的民宿出租信息,下面我们以成都地区的租房信息为例,来尝试爬取这些数据. 1.爬取租房标题 按照惯例,先来爬下标题试试水,找到标题,复制xpath. 多复制几个房屋 ...
最新文章
- python 栈_Python数据结构与算法05:基本结构:栈的应用之括号匹配
- PyCharm的隐藏技巧(Tips)-快捷键等积累
- win8--PPTP教程
- 242. 有效的字母异位词 golang
- 如何判断SVG事件对象中的鼠标来源?
- 如何写一个数据库中间件以及需要准备的知识储备
- python函数拟合求导_python – 使用scipy curve_fit通过两个数据点拟合指数函数
- 【转】字符串和浮点数格式化输出小结
- JAVA 设计模式 适配器模式
- 2014-2015 ACM-ICPC, NEERC, Eastern Subregional Contest Problem H. Pair: normal and paranormal
- 参加一场 Google IO 需要多少资金?
- matlab心理学函数包,心理学研究方法:基于MATLAB和PSYCHTOOLBOX
- AI足球预测软件|足球大数据预测分析
- flask的一个小项目
- 【课程设计】基于图像处理的一维条形码识别-含matlab源码
- 【金融123】ISDA协议
- 华为芯片设计面试题_华为公司面试硬件工程师笔试题
- 如何把操作系统迁移到新电脑/硬盘
- 6 电脑键盘控制机器人
- Android自定义Drawable第十五式之啡常OK
热门文章
- 网络协议——一张图看懂网络分层
- 以掘金示例,利用内链/外链进行网站SEO优化
- java毕业设计物业管理系统mybatis+源码+调试部署+系统+数据库+lw
- 免费×××帐号 送送送
- 我的世界 for Mac(沙盒游戏)原生版支持Big Sur
- APM(pixhawk)飞控疑难杂症解决方法汇总
- 鼎盛合|便携汽车轮胎充气泵方案
- 电脑开始锁定计算机有什么用,电脑Scroll Lock键有什么用的
- databus mysql搭建_【databus】初识Databus
- 中国电信预计宽带资费未来将持续下降