本篇文章介绍爬虫爬取某租房信息数据,数据仅用于学习使用无商业用途。

首先在Python Console 控制台中安装requests、parsel模块,requests发送网络请求获取数据,parsel用于对数据源进行解析。

pip install requestspip install parsel

下面开始实操代码:

import requests
import parsel# file = open("C:\\Users\\AUSU\\Desktop\\租房数据.txt", "a")
# for i in range(98):
# url = "https://hz.lianjia.com/zufang/pg" + str(i + 2) + "rt200600000002/#contentList"
url = "https://nj.lianjia.com/zufang/pg3/#contentList"
header = {"user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/98.0.4758.82 Safari/537.36"
}
response = requests.get(url=url, headers=header)
selector = parsel.Selector(response.text)lis = selector.css(".content__list--item--main ")
for li in lis:title = li.css(".content__list--item--title a::text").getall()if title:info = str(title).replace("\\n", "").replace(" ", "").replace("[", "").replace("'", "").replace("]", "")location: list = li.css(".content__list--item--des a::text").getall()if location:area = str("-".join(location))address: list = li.css(".content__list--item--des ::text").getall()if address:addressInfo = str(address).replace("\\n", "").replace(" ", "").replace("[", "").replace("]", "") \.replace("'-'", "").replace("'", "").replace(",", "")price = li.css(".content__list--item-price em::text").get()result = info + "|" + area + "|" + addressInfo + "|" + price + "元"# file.write(result)# file.write("\n")print(result)

Python爬虫爬取网页数据相关推荐

  1. Python爬虫爬取网页数据并存储(一)

    Python爬虫爬取网页数据并存储(一) 环境搭建 爬虫基本原理 urllib库使用 requests库使用 正则表达式 一个示例 环境搭建 1.需要事先安装anaconda(或Python3.7)和 ...

  2. python如何爬虫网页数据-python爬虫——爬取网页数据和解析数据

    1.网络爬虫的基本概念 网络爬虫(又称网络蜘蛛,机器人),就是模拟客户端发送网络请求,接收请求响应,一种按照一定的规则,自动地抓取互联网信息的程序. 只要浏览器能够做的事情,原则上,爬虫都能够做到. ...

  3. python爬虫数据分析可以做什么-python爬虫爬取的数据可以做什么

    在Python中连接到多播服务器问题,怎么解决你把redirect关闭就可以了.在send时,加上参数allow_redirects=False 通常每个浏览器都会设置redirect的次数.如果re ...

  4. python 爬虫爬取疫情数据,爬虫思路和技术你全都有哈(一)

    python 爬虫爬取疫情数据,爬虫思路和技术你全都有哈(二.数据清洗及存储) 爬起疫情数据,有两个网址: 1.百度:链接 2.丁香园疫情:链接 在这两个中,丁香园的爬虫相对简单一点,所以今天就展示一 ...

  5. python初学-爬取网页数据

    python初学-爬取网页数据 1,获取网页源代码 import urllib url = 'http://www.163.com'wp = urllib.urlopen(url) file_cont ...

  6. Python爬虫爬取疫情数据并可视化展示

    这篇文章主要介绍了Python利用爬虫爬取疫情数据并进行可视化的展示,文中的示例代码讲解清晰,对工作或学习有一定的价值,需要的朋友可以参考一下.编程资料点击领取 目录 知识点 开发环境 爬虫完整代码 ...

  7. python 爬虫爬取疫情数据,爬虫思路和技术你全都有哈(二)

    上一章: python 爬虫爬取疫情数据,爬虫思路和技术你全都有哈(一.爬虫思路及代码) 第三步:数据清洗 清洗数据很简单,就是数据太乱的话,就得花些时间,所以一定要有一个好的方法,才能避免在清洗数据 ...

  8. python爬虫爬取网页新闻标题-看完保证你会

    python爬虫爬取网页新闻标题方法 1.首先使用浏览自带的工具--检查,查找网页新闻标题对应的元素位置,这里查到的新闻标题是在 h3 标签中 2.然后使用编辑器编写python代码 2.1方法一: ...

  9. python爬取网页代码-python爬虫爬取网页所有数据详细教程

    Python爬虫可通过查找一个或多个域的所有 URL 从 Web 收集数据.Python 有几个流行的网络爬虫库和框架.大家熟知的就是python爬取网页数据,对于没有编程技术的普通人来说,怎么才能快 ...

  10. python爬虫爬取网页上的天气数据

    目录 一:获取网页重要信息 二:爬取网页数据 三:源码分享 一:获取网页重要信息 在要爬取数据信息的网页上,F12进入查看网页内容 二:爬取网页数据 1 导入模块 import requests fr ...

最新文章

  1. 干货 | 一文总结机器学习类面试问题与思路
  2. 装饰者模式源码解析(spring-session mybatis jdk servlet)
  3. Java 13 的下载安装教程
  4. qwidget多个窗口同步_【好人BUG】本机多组控制 一台电脑使用一个帐号登录多个(省钱) !...
  5. Visual Studio 选择相同变量高亮
  6. 深度学习(2)--常见概率分布(1)
  7. 分布式数据库中间件对比总结
  8. mysql group by 查询慢_MySQL慢查询优化(线上案例调优)
  9. C++语言类的详解和示例
  10. hdu 4355 Party All the Time
  11. Makefile中变量赋值方式
  12. 组合数学1.1——棋盘的完美覆盖
  13. Linux下安装gcc和g++
  14. Alex 的 Hadoop 菜鸟教程: 第6课 Hbase 安装教程
  15. 小米手机助手linux,小米手机助手怎么用?小米手机助手教程
  16. tomcat是干什么的
  17. Spark Streaming系列-1、什么是Spark Streaming?
  18. 新华DCS系统MODBUS通讯仿真测试方法介绍
  19. 网络邻居没有查看工作组计算机,解决Windows 10 系统看不到网上邻居工作组里的其他计算机-win7网上邻居...
  20. php deel views,视图 - Views

热门文章

  1. csgo如何旋转跳?如何连跳
  2. RNA editing restricts hyperactive ciliary kinases文章翻译
  3. 定制网站建设流程有哪些
  4. python画出分子化学空间分布(UMAP)
  5. 米家扫地机器人尘盒怎么取_米家扫地机器人怎么清理灰尘盒_米家扫地机器人怎么倒出垃圾...
  6. k8s 集群全部更换机器 IP
  7. python爬虫登录微博_[突如其来]python爬虫模拟登录微博
  8. CANoe-第2个仿真工程-XVehicle—2Panel设计(原理,思路)
  9. windows10开机时出现你的设备遇到问题,需要重启
  10. 魔兽争霸——《冰封王座》2007魔兽比赛背景音乐下载