爬取南京链家租房信息

代码如下 代码片.
import requests
from lxml import etree
if name == “main”:
#设置一个通用URL模板
headers={
‘User-Agent’:‘Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.88 Safari/537.36’
}
url=‘https://nj.lianjia.com/zufang/pg%d’
fp=open(‘lianjia.txt’,‘w’,encoding=‘utf-8’)
for pagenum in range(1,101):
new_url=format(url%pagenum)
page_text=requests.get(url=new_url,headers=headers).text
tree=etree.HTML(page_text)
div_list=tree.xpath(’//div[@class=“content__list”]/div’)
for div in div_list:
title=div.xpath(’./div/p/a/text()’)[0]
price=div.xpath(’./div/span/em/text()’)[0]
print(title+price+“元/月”)
fp.write(title+price+“元/月”)

爬取南京链家租房信息相关推荐

  1. 爬取广州链家租房信息,并用tableau进行数据分析

    在外工作,难免需要租房子,而链家是现在比较火的一个租房网站,本文章主要是爬取链家在广州的租房信息,并且进行简单的数据分析. 数据采集 如图所示,我们需要的信息主要是存放在这个标签里面,我们把信息采集下 ...

  2. python爬虫--爬取链家租房信息

    python 爬虫-链家租房信息 爬虫,其实就是爬取web页面上的信息. 链家租房信息页面如下: https://gz.lianjia.com/zufang/ ## python库 Python库 1 ...

  3. Python爬虫框架Scrapy入门(三)爬虫实战:爬取长沙链家二手房

    Item Pipeline介绍 Item对象是一个简单的容器,用于收集抓取到的数据,其提供了类似于字典(dictionary-like)的API,并具有用于声明可用字段的简单语法. Scrapy的It ...

  4. 用Python爬取2020链家杭州二手房数据

    起源于数据挖掘课程设计的需求,参考着17年这位老兄写的代码:https://blog.csdn.net/sinat_36772813/article/details/73497956?utm_medi ...

  5. 爬取‘广州链家新房’数据并以csv形式保存。

    --本次的目标是爬取'广州链家新房'前十页的信息,具体需要爬取的信息为'楼房名字.地址.价格以及是否在售的情况',具体的代码如下. import requests,time import pandas ...

  6. Python爬虫入门 | 5 爬取小猪短租租房信息

    小猪短租是一个租房网站,上面有很多优质的民宿出租信息,下面我们以成都地区的租房信息为例,来尝试爬取这些数据. 小猪短租(成都)页面:http://cd.xiaozhu.com/   1.爬取租房标题 ...

  7. Python疫起学习·万丈高楼平地起Day09(精简版|浓缩就是精华)爬虫知识附上案例爬取北京地区短租房信息、爬取酷狗TOP500的数据以及爬取网易云音乐热歌榜单

    爬虫知识 Requests库 部分运行结果如下: 有时爬虫需要加入请求头来伪装成浏览器,以便更好地抓取数据.在Chrome浏览器中按F12键打开Chrome开发者工具,刷新网页后找到User-Agen ...

  8. 简单python脚本 爬取杭州链家二手房 房价信息

    爬取链家房价信息 主要使用以下库: requests BeautifulSoup 相关问题 当爬取次数太多的时候,可能会遇到被封的情况或者验证码, 大佬们可以自行解决,这个脚本里面我就不掺和了,毕竟我 ...

  9. python爬取网上租房信息_Python爬虫入门 | 5 爬取小猪短租租房信息

    小猪短租是一个租房网站,上面有很多优质的民宿出租信息,下面我们以成都地区的租房信息为例,来尝试爬取这些数据. 1.爬取租房标题 按照惯例,先来爬下标题试试水,找到标题,复制xpath. 多复制几个房屋 ...

最新文章

  1. python 栈_Python数据结构与算法05:基本结构:栈的应用之括号匹配
  2. PyCharm的隐藏技巧(Tips)-快捷键等积累
  3. win8--PPTP教程
  4. 242. 有效的字母异位词 golang
  5. 如何判断SVG事件对象中的鼠标来源?
  6. 如何写一个数据库中间件以及需要准备的知识储备
  7. python函数拟合求导_python – 使用scipy curve_fit通过两个数据点拟合指数函数
  8. 【转】字符串和浮点数格式化输出小结
  9. JAVA 设计模式 适配器模式
  10. 2014-2015 ACM-ICPC, NEERC, Eastern Subregional Contest Problem H. Pair: normal and paranormal
  11. 参加一场 Google IO 需要多少资金?
  12. matlab心理学函数包,心理学研究方法:基于MATLAB和PSYCHTOOLBOX
  13. AI足球预测软件|足球大数据预测分析
  14. flask的一个小项目
  15. 【课程设计】基于图像处理的一维条形码识别-含matlab源码
  16. 【金融123】ISDA协议
  17. 华为芯片设计面试题_华为公司面试硬件工程师笔试题
  18. 如何把操作系统迁移到新电脑/硬盘
  19. 6 电脑键盘控制机器人
  20. Android自定义Drawable第十五式之啡常OK

热门文章

  1. 网络协议——一张图看懂网络分层
  2. 以掘金示例,利用内链/外链进行网站SEO优化
  3. java毕业设计物业管理系统mybatis+源码+调试部署+系统+数据库+lw
  4. 免费×××帐号 送送送
  5. 我的世界 for Mac(沙盒游戏)原生版支持Big Sur
  6. APM(pixhawk)飞控疑难杂症解决方法汇总
  7. 鼎盛合|便携汽车轮胎充气泵方案
  8. 电脑开始锁定计算机有什么用,电脑Scroll Lock键有什么用的
  9. databus mysql搭建_【databus】初识Databus
  10. 中国电信预计宽带资费未来将持续下降