前言

嗨喽~大家好呀,这里是魔王呐 !

思路

一.分析数据来源

链家二手房数据:多页《—一页

二.案例代码实现

  1. 发送请求,向目标网址发送数据请求

  2. 获取网页源代码<响应文本信息>

  3. 解析数据

  4. 保存数据

采集代码

from lxml import etree
import csv
import requests

因CSDN不能出现网站链接,所以我把下图代码删了,大家可以按照下图片把它添加一下

headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/105.0.0.0 Safari/537.36'
}html = requests.get(url=url, headers=headers)
# print(html.text)
# 解析   转换数据类型
soup = etree.HTML(html.text)
# print(soup)
doc = soup.xpath('//*[@id="content"]/div[1]/ul/li')
# print(doc)list_1 = []
for fang in doc:name = fang.xpath('.//div[@class="title"]/a/text()')[0]# print(len(name))# print(name)address = fang.xpath('.//div[@class="positionInfo"]/a/text()')# print(len(address))# print(address)# for i in range(len(address)):if address:address = '-'.join(address)# print(address)# 价格price = fang.xpath('.//div[@class="totalPrice totalPrice2"]/span/text()')[0]# print(price)list_1.append([name, address, float(price)])print(list_1)
for p in list_1:list_2 = pprint(list_2)file = open('ershoufang.csv', mode='a', newline='')csv_write = csv.writer(file)csv_write.writerow(list_2)

图表

import pandas as pd
from pyecharts.charts import Bar
from pyecharts import optionsdata = pd.read_csv('./ershoufang.csv', names=['name', 'address', 'price'], encoding='gbk')
print(data)bar = Bar()
bar.add_xaxis(list(data['address']))
bar.add_yaxis('长沙二手房房价图', list(data['price']))bar.set_global_opts(title_opts=options.TitleOpts(title="长沙二手房价图表"),datazoom_opts=options.DataZoomOpts()
)
bar.render('长沙二手房房价图.html')


尾语

要成功,先发疯,下定决心往前冲!

学习是需要长期坚持的,一步一个脚印地走向未来!

未来的你一定会感谢今天学习的你。

—— 心灵鸡汤

本文章到这里就结束啦~感兴趣的小伙伴可以复制代码去试试哦

【python】带你采集房源数据并作房价分析相关推荐

  1. 给我一个西门子plc采集大数据存储与分析方案

    对于西门子PLC采集大数据存储与分析方案,下面是一个建议: 数据采集: 在PLC中设置数据采集程序,以记录关键数据并定期发送到数据存储仓库. 数据存储: 使用大数据存储技术,例如 Hadoop.Spa ...

  2. chatgpt赋能python:Python制表位:优化数据可视化与分析的利器

    Python 制表位:优化数据可视化与分析的利器 在数据可视化和分析中,表格是一种常用的数据展示方式.Python 提供了丰富的用于构建表格的库,其中之一便是制表位(Tabulate).本文将介绍制表 ...

  3. python带你采集淘/苏/唯/考四大电商平台商品数据

    前言 嗨喽,大家好呀~这里是爱看美女的茜茜呐 又到了学Python时刻~ 环境介绍: python 3.8 越稳定越好 pycharm 2021专业版 一.苏宁 模块使用: selenium > ...

  4. 【Python】实时采集疫情数据,打造可视化地图,防疫从你我做起

    文章目录 一.写在前面 二.准备工作 2.1.开发环境 2.2.知识点 三.爬虫部分 3.1.爬虫流程 3.2.数据采集 四.数据可视化部分 五.视频教程 六.写在最后 一.写在前面 兄弟们,最近又是 ...

  5. 【Python】pandas获取全省人口数据并作可视化分析

    前言 目录 前言 代码实现 可视化分析 今天我们看看自己所在的省份的人口人数,使用pandas并作可视化分析. 环境使用 python 3.9 pycharm 模块使用 pandas Pandas 是 ...

  6. python带你采集各种表情包,做群里最靓的崽~

    前言 大家早好.午好.晚好吖~ 环境使用: Python 3.8 Pycharm 2021.2版本 模块使用: import requests >>> pip install req ...

  7. 利用matlab mobile采集GPS数据进行可视化分析

    Hello啊,GPS数据在交通大数据分析中起到了很大作用,.....(不想写废话了,直接开始吧) 首先,需要在手机上下载matlab移动端,iOS和安卓系统都可以下,我刚开始学习matlab的时候用过 ...

  8. python带你采集桌游、剧本杀游戏店数据信息~

    前言 嗨喽~大家好呀,这里是魔王呐 ! 又是学习的一天,让我们开始叭~ 环境使用: Python 3.8 Pycharm 模块使用: requests >>> pip install ...

  9. python带你采集不可言说网站数据,并带你多重骚操作~

    前言 嗨喽,大家好呀,这里是魔王呐~ 今天我们采集国内知名的shipin弹幕网站! 这里有及时的动漫新番,活跃的ACG氛围,有创意的Up主. 大家可以在这里找到许多欢乐. 目录(可根据个人情况点击你想 ...

最新文章

  1. python3 print设置不换行
  2. html5时间轴列表,HTML5 时间轴/日程安排表模板
  3. 合并多个文本文件方法
  4. C++decltype关键字
  5. iptables 防火墙(上)
  6. 不要一辈子靠技术生存!!
  7. 论文浅尝 | 知识图谱问答中的层次类型约束主题实体识别
  8. python是谁维护的_Python是维护拆分的更可靠的方法
  9. Mvvm 前端数据流框架精讲
  10. 代码协定(三)——假定和断言
  11. 宿松的小孤山在安徽省内有名吗?
  12. 不存在的泳池 DFS
  13. @程序员,2019 年软件开发新趋势必知!
  14. Invalid Gradle JDK configuration found_build.gradle里dependencies标签页的实现原理
  15. python shell 运行时不打印日志_shell编程
  16. java线程 stop()_Java中的线程Thread方法之---stop()
  17. TestNG使用教程
  18. Ruby+Selenium demo
  19. 科沃斯擦窗机器人擦不干净怎么办_科沃斯窗宝能擦到玻璃的边角么想买个擦窗机器人,就是担心擦不干净,尤其是窗子边角的地方,要是还要人返工,那不如找钟点工来擦了...
  20. Win11找不到wt.exe如何解决?

热门文章

  1. 北京一家盛世,黑中介,还老改名,又叫北京一家天天物业管理,还有很多其它的名字,大家小心
  2. 【雅思阅读】王希伟阅读P1(阅读判断题)
  3. 瑞典沃尔沃轿车公司再次召回
  4. 华兴数控g71外圆循环编程_数控G71内外圆粗车循环指令教案
  5. android立体3D效果_PS教程:铝膜气球字制作的完整教程,3D立体效果字体的制作...
  6. 新光大ArtPark9亮相 以“艺术”再造生活方式
  7. cardinality mysql_Cardinality统计取值不准确导致MYSQL选错索引
  8. 【安全资讯】起因222个摄像头,特斯拉工厂教会IoT行业的事
  9. kstest 检验数据是否符合正态分布
  10. TI DSP系列分类