其实这是一个半途而废的“作品”(捂脸)
我的想法是:首先,我把链家上北京房价爬取下来保存为表格,每行有编号、小区和价格三个属性,然后通过百度地图API获得小区的经纬度,最后绘制热力图,康康红色的区域(房价最高位置)到绿色区域颜色过渡的分布,即房价分布吧,这个步骤是参考的[Python调用百度地图]。(https://blog.csdn.net/xxzj_zz2017/article/details/79396980)
但是,我只做了第一步,把链家房价数据爬取下来了,好吧,我还申请了一个百度地图的账号,所以为啥我不继续做下去嘞?因为,没动力了,不想做了,后面好麻烦啊,我老友记还没看完,我的人鱼线还没练出来,亲爱的热爱的韩商言好帅啊(我从法医秦明第一部就是张若昀演秦明那里就开始关注李现了,当时他有穿一件军绿色外套好看极了,然后看了他跟张若昀演的电影奇葩朵朵,挺颠覆形象的,还有电影睡在我上铺的兄弟,挺感人的,所以我在说些什么狗屁玩意,抱歉,来,继续说李现,不不不,这个代码,哈哈)
链家的网页是html类型的,跟bilibili一样,我之前写了个爬取b站排名靠前vlog的主题,所以这次代码有参考当时的,因为import urllib/BeautifulSoup/re库都是一样的。不过这次找内容有点麻烦,就是关键词的截取,不过最后写出来了(哎呦,不错哦)。直接康代码了,不解释。
代码

import urllib
import time
import re
from bs4 import BeautifulSoup as bs
import csv#获得房价
def get_price():base_url="https://bj.lianjia.com/zufang/"#第一页for page in range(2,5):#后几页url=base_url+"/pg"+str(page)+"/"html=urllib.request.urlopen(url).read()soup=bs(html,'html.parser',from_encoding="utf-8")f=open("D://cs//python//summer//house_price.csv",'a',newline='')#打开文件csv_writer=csv.writer(f,dialect='excel')#设置写入模式i=0#编号try:for each in soup.find_all('div',{"class":"content__list--item--main"}):title=each.find('a').get_text()#获得小区位置title=title.lstrip()#去除左边空格print(title)if '·' in title:xiaoqu=re.findall(r'·(.*?) ', title)[0]else:xiaoqu=title.split()[0]print(xiaoqu)p=each.find('span',{"class":"content__list--item-price"})price=p.find('em').get_text()#获得房价print(price)hp=[i,xiaoqu,price]#一行信息csv_writer.writerow(hp)#写入一行i+=1time.sleep(0.5)except:print("error")get_price()


之后发挥一下高超的excel才能把数据整理一下,做个透视表啊啥的挺好的。或者完成热力图吧,我是let it go了,别学我哈。其实这篇就算水水了,打个卡8.

Python爬取链家北京租房房价|保存为csv格式文件相关推荐

  1. Python爬取链家北京租房信息!北京租房都租不起啊!

    一.效果图 二.代码 import re from fake_useragent import UserAgent from lxml import etree import asyncio impo ...

  2. Python爬取链家北京租房信息

    刚学习了python,中途遇到很多问题,查了很多资料,最关键的就是要善于调试,div信息一定不要找错,下面就是我爬取租房信息的代码和运行结果: 链家的房租网站 两个导入的包 1.requests 用来 ...

  3. 爬取链家北京租房数据并做简单分析

    在一个来北京不久的学生眼中,北京是一个神秘又充满魅力的大城市.它无比美好,但又无时无刻不再觊觎这你薄弱的钱包. 租房是很多人都离不开的硬性需求,这里就对从链家爬取的北京地区房屋出租数据进行一个简单分析 ...

  4. python爬取链家房价消息_Python的scrapy之爬取链家网房价信息并保存到本地

    因为有在北京租房的打算,于是上网浏览了一下链家网站的房价,想将他们爬取下来,并保存到本地. 先看链家网的源码..房价信息 都保存在 ul 下的li 里面 ​ 爬虫结构: ​ 其中封装了一个数据库处理模 ...

  5. python爬房源信息_用python爬取链家网的二手房信息

    题外话:这几天用python做题,算是有头有尾地完成了.这两天会抽空把我的思路和方法,还有代码贴出来,供python的初学者参考.我python的实战经历不多,所以代码也是简单易懂的那种.当然过程中还 ...

  6. python爬取链家网的房屋数据

    python爬取链家网的房屋数据 爬取内容 爬取源网站 爬取内容 爬取思路 爬取的数据 代码 获取房屋url 获取房屋具体信息 爬取内容 爬取源网站 北京二手房 https://bj.lianjia. ...

  7. python 爬取链家数据_用python爬取链家网的二手房信息

    题外话:这几天用python做题,算是有头有尾地完成了.这两天会抽空把我的思路和方法,还有代码贴出来,供python的初学者参考.我python的实战经历不多,所以代码也是简单易懂的那种.当然过程中还 ...

  8. python关于二手房的课程论文_基于python爬取链家二手房信息代码示例

    基本环境配置 python 3.6 pycharm requests parsel time 相关模块pip安装即可 确定目标网页数据 哦豁,这个价格..................看到都觉得脑阔 ...

  9. 租房不入坑不进坑,Python爬取链家二手房的数据,提前了解租房信息

    目录 前言 一.查找数据所在位置: 二.确定数据存放位置: 三.获取html数据: 四.解析html,提取有用数据: 前言 贫穷限制了我的想象,从大学进入到社会这么久,从刚开始的兴致勃勃,觉得钱有什么 ...

  10. python爬取链家新房_Python爬虫实战:爬取链家网二手房数据

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. 买房装修,是每个人都要经历的重要事情之一.相对于新房交易市场来说,如今的二手房交易市场一点也 ...

最新文章

  1. python数据结构与算法:队列与双端队列
  2. 原生态纯JavaScript 100大技巧大收集
  3. python中表示红色的表达式_python-SymPy中表达式的抽象表示
  4. xml的方式配置AOP:Aspect Oriented Programming
  5. linux 命令行工具无敌斩
  6. 首次使用Gradle配置本地仓库和更好国内镜像源
  7. linux内存的active,Linux性能优化和监控系列(三)——分析Memory使用状况
  8. 金九银十,年轻人跳槽时,尽量不要选择这三类得不偿失的公司
  9. TLS1.3---密钥的计算
  10. fft和freqz的区别
  11. postman安装和安装后双击没反应
  12. wps页眉怎么设置不同页码_wps版word怎么从第二页设置页眉页脚
  13. C#自制简易弹钢琴谱
  14. DDoS Deflate 的安装和使用
  15. Java将OFD文件转PDF文件
  16. todos各个组件代码
  17. Android UI + Function
  18. 李成名:科学就是较真 数字城市/智慧城市就是跑马圈地
  19. 移动安全--37--说说Android软件壳
  20. 剑指offer--序列化与反序列化二叉树(先序递归,建树)

热门文章

  1. 中国AI监控摄像头市场现状研究分析与发展前景预测报告(2022)
  2. win10如何查看服务器日志文件,系统日志在哪里?win10系统错误日志怎么查看
  3. K.function的用法
  4. 你知道了区块链,现在该了解DCEP央行数字货币了
  5. 机器人视觉硬件方案设计对比
  6. 老罗的工匠精神是不是有唯一性
  7. F5 LTM ping 数据包丢包解决过程
  8. localhost 已拒绝连接
  9. php 中%3cspan%3e,隐藏第三方网站统计图标
  10. 翟菜花:汽车市场首度遇冷,下沉市场与二手车会是破冰利器吗?