Python爬虫(一)——58同城租房信息
代码:
1 # coding=utf-82 import sys3 import csv4 import requests5 from bs4 import BeautifulSoup6 7 reload(sys)8 sys.setdefaultencoding('utf-8')9 # 请求头设置
10
11 def download(url):
12 db_data = requests.get(url)
13 soup = BeautifulSoup(db_data.text, 'lxml')
14 titles = soup.select(
15 'body > div.mainbox > div.main > div.content > div.listBox > ul > li > div.des > h2 > a:nth-of-type(1)')
16 houses = soup.select('body > div.mainbox > div.main > div.content > div.listBox > ul > li > div.des > p.room')
17 oneaddresss = soup.select(
18 'body > div.mainbox > div.main > div.content > div.listBox > ul > li > div.des > p.add > a:nth-of-type(1)')
19 twoaddresss = soup.select(
20 'body > div.mainbox > div.main > div.content > div.listBox > ul > li > div.des > p.add > a:nth-of-type(2)')
21 prices = soup.select(
22 'body > div.mainbox > div.main > div.content > div.listBox > ul > li > div.listliright > div.money > b')
23 for title, house, oneaddress, twoaddress, price in zip(titles, houses, oneaddresss, twoaddresss, prices):
24 data = [
25 (
26 str(title.string).replace(' ', '').replace('\n', ''),
27 house.get_text().split(' ')[0].replace(' ', '').replace("\n", ""),
28 house.get_text().split(' ')[-1].replace(' ', '').replace("\n", ""),
29 oneaddress.get_text().replace(' ', '').replace("\n", ""),
30 twoaddress.get_text().replace(' ', '').replace("\n", ""),
31 price.get_text().replace(' ', '').replace("\n", "")
32 )
33 ]
34
35 csvfile = open('kf.csv', 'ab')
36 writer = csv.writer(csvfile)
37 print('write one house')
38 writer.writerows(data)
39 csvfile.close()
40
41
42 # 初始化csv文件
43 def info():
44 csvinfo = open('kf.csv', 'ab')
45 begcsv = csv.writer(csvinfo)
46 begcsv.writerow(['title', 'house', 'area', 'address1', 'address2', 'price'])
47 csvinfo.close()
48
49
50 if __name__ == '__main__':
51 info()
52 download(url)
对Python感兴趣或者是正在学习的小伙伴,可以加入我们的Python学习扣qun:784758214,看看前辈们是如何学习的!从基础的python脚本到web开发、爬虫、django、数据挖掘等,零基础到项目实战的资料都有整理。送给每一位python的小伙伴!分享一些学习的方法和需要注意的小细节,教你如何实现边学习边用Python赚钱的学习方式。点击加入我们的 python学习者聚集地
Python爬虫(一)——58同城租房信息相关推荐
- python爬取58同城租房信息_分页爬取58同城租房信息.py
import requests,re,openpyxl,os headers = { 'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleW ...
- python爬取58同城租房信息,用selenium爬取58同城租房信息(万级数据)
今天想做一个58同城的爬虫,然后到页面分析一下链接,发现58同城的链接的有些参数是由js动态生成的,然后我就想偷懒了.(当然其实去js文件中找到生成式并不难),但我就是不想去找.然后就想到了selen ...
- python爬取58同城租房信息_python爬虫:找房助手V1.0-爬取58同城租房信息(示例代码)...
#!/usr/bin/python # -*- encoding:utf-8 -*-importrequests frombs4 importBeautifulSoup frommultiproces ...
- python爬取58同城租房信息
代码: # coding=utf-8 import sys import csv import requests from bs4 import BeautifulSoup ''' 遇到不懂的问题?P ...
- 58上租房显示服务器异常,“58同城租房信息”满是套路,你中招了吗?
原标题:"58同城租房信息"满是套路,你中招了吗? 58同城,大家都很熟悉.尤其是那句广告词:58同城,一个神奇的网站.网站的确是挺神奇的,招工信息.租房信息各种信息无奇不有,然而 ...
- python实战|python爬取58同城租房数据并以Excel文件格式保存到本地
python实战|python爬取58同城租房数据并以Excel文件格式保存到本地 一.分析目标网站url 目标网站:https://cq.58.com/minsuduanzu/ 让我们看看网站长啥样 ...
- 深圳python爬虫培训南山科技园钽电容回收_记一次python 爬虫爬取深圳租房信息的过程及遇到的问题...
为了分析深圳市所有长租.短租公寓的信息,爬取了某租房公寓网站上深圳区域所有在租公寓信息,以下记录了爬取过程以及爬取过程中遇到的问题: 爬取代码: import requests from reques ...
- python解决租房问题_记一次python 爬虫爬取深圳租房信息的过程及遇到的问题
为了分析深圳市所有长租.短租公寓的信息,爬取了某租房公寓网站上深圳区域所有在租公寓信息,以下记录了爬取过程以及爬取过程中遇到的问题: 爬取代码: import requests from reques ...
- python爬虫:找房助手V1.0-爬取58同城租房信息
前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取 python免费学习资 ...
最新文章
- Deep learning的一些教程 (转载)
- android上下文关系,Android Context上下文的理解 Hua
- RedHat 6配置DNS服务实现主从同步与正反向解析
- 设计模式 分类和原则
- python3 Connection aborted.', RemoteDisconnected('Remote end closed connection without response'
- git两个账号切换_Git切换账号方法
- 第一场“直播相声”来了!罗永浩宣布独家签约抖音:不赚钱,交个朋友
- rockycapture_RockyCapture航线规划软件介绍文档
- WebStorm学习笔记002---grunt-watch插件的使用-修改html,css,js文件实现自动编译更新
- C/C++中函数指针的含义(转)
- FOSRestBundle功能包:概述
- Android 返回键的处理
- NodeJs之http
- linux shell $#获取所有参数的个数 $@获取所有参数
- Axure|【民宿】民宿APP原型
- SpringDataJpa原理及使用
- 你知道CDN是什么吗?本文带你搞明白CDN
- 如何用python制作动画电影_用Python制作3D动画
- 怪物之心无法触发_《异度神剑2》力男支线任务怪物之心流程介绍
- 微信小程序之微信登陆 —— 微信小程序教程系列(20)
热门文章
- ORAN传输封装类型
- mac系统升级导致VirtualBox报Kernel driver not installed (rc=-1908)
- 使用sklearn构建完整的回归项目(一)
- spss对数据进行聚类分析(系统聚类法和k-均值聚类法)和判别分析(费歇尔和贝叶斯)。
- 微商分销系统哪家好,要怎么做?
- 电商订单系统,你该如何设计
- JS 网页打印解决方案
- 计算机无法显示输入法怎么办,win7系统电脑输入法选项不见了导致无法输入中文怎么办...
- linux查看文件打开限制,Linux最大文件打开数使用经验详解
- vmbox 导入虚拟电脑之后无法上网