代码:

1 # coding=utf-82 import sys3 import csv4 import requests5 from bs4 import BeautifulSoup6 7 reload(sys)8 sys.setdefaultencoding('utf-8')9 # 请求头设置
10
11 def download(url):
12     db_data = requests.get(url)
13     soup = BeautifulSoup(db_data.text, 'lxml')
14     titles = soup.select(
15         'body > div.mainbox > div.main > div.content > div.listBox > ul > li > div.des > h2 > a:nth-of-type(1)')
16     houses = soup.select('body > div.mainbox > div.main > div.content > div.listBox > ul > li > div.des > p.room')
17     oneaddresss = soup.select(
18         'body > div.mainbox > div.main > div.content > div.listBox > ul > li > div.des > p.add > a:nth-of-type(1)')
19     twoaddresss = soup.select(
20         'body > div.mainbox > div.main > div.content > div.listBox > ul > li > div.des > p.add > a:nth-of-type(2)')
21     prices = soup.select(
22         'body > div.mainbox > div.main > div.content > div.listBox > ul > li > div.listliright > div.money > b')
23     for title, house, oneaddress, twoaddress, price in zip(titles, houses, oneaddresss, twoaddresss, prices):
24         data = [
25             (
26                 str(title.string).replace(' ', '').replace('\n', ''),
27                 house.get_text().split(' ')[0].replace(' ', '').replace("\n", ""),
28                 house.get_text().split(' ')[-1].replace(' ', '').replace("\n", ""),
29                 oneaddress.get_text().replace(' ', '').replace("\n", ""),
30                 twoaddress.get_text().replace(' ', '').replace("\n", ""),
31                 price.get_text().replace(' ', '').replace("\n", "")
32             )
33         ]
34
35         csvfile = open('kf.csv', 'ab')
36         writer = csv.writer(csvfile)
37         print('write one house')
38         writer.writerows(data)
39         csvfile.close()
40
41
42 # 初始化csv文件
43 def info():
44     csvinfo = open('kf.csv', 'ab')
45     begcsv = csv.writer(csvinfo)
46     begcsv.writerow(['title', 'house', 'area', 'address1', 'address2', 'price'])
47     csvinfo.close()
48
49
50 if __name__ == '__main__':
51     info()
52     download(url)

对Python感兴趣或者是正在学习的小伙伴,可以加入我们的Python学习扣qun:784758214,看看前辈们是如何学习的!从基础的python脚本到web开发、爬虫、django、数据挖掘等,零基础到项目实战的资料都有整理。送给每一位python的小伙伴!分享一些学习的方法和需要注意的小细节,教你如何实现边学习边用Python赚钱的学习方式。点击加入我们的 python学习者聚集地

Python爬虫(一)——58同城租房信息相关推荐

  1. python爬取58同城租房信息_分页爬取58同城租房信息.py

    import requests,re,openpyxl,os headers = { 'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleW ...

  2. python爬取58同城租房信息,用selenium爬取58同城租房信息(万级数据)

    今天想做一个58同城的爬虫,然后到页面分析一下链接,发现58同城的链接的有些参数是由js动态生成的,然后我就想偷懒了.(当然其实去js文件中找到生成式并不难),但我就是不想去找.然后就想到了selen ...

  3. python爬取58同城租房信息_python爬虫:找房助手V1.0-爬取58同城租房信息(示例代码)...

    #!/usr/bin/python # -*- encoding:utf-8 -*-importrequests frombs4 importBeautifulSoup frommultiproces ...

  4. python爬取58同城租房信息

    代码: # coding=utf-8 import sys import csv import requests from bs4 import BeautifulSoup ''' 遇到不懂的问题?P ...

  5. 58上租房显示服务器异常,“58同城租房信息”满是套路,你中招了吗?

    原标题:"58同城租房信息"满是套路,你中招了吗? 58同城,大家都很熟悉.尤其是那句广告词:58同城,一个神奇的网站.网站的确是挺神奇的,招工信息.租房信息各种信息无奇不有,然而 ...

  6. python实战|python爬取58同城租房数据并以Excel文件格式保存到本地

    python实战|python爬取58同城租房数据并以Excel文件格式保存到本地 一.分析目标网站url 目标网站:https://cq.58.com/minsuduanzu/ 让我们看看网站长啥样 ...

  7. 深圳python爬虫培训南山科技园钽电容回收_记一次python 爬虫爬取深圳租房信息的过程及遇到的问题...

    为了分析深圳市所有长租.短租公寓的信息,爬取了某租房公寓网站上深圳区域所有在租公寓信息,以下记录了爬取过程以及爬取过程中遇到的问题: 爬取代码: import requests from reques ...

  8. python解决租房问题_记一次python 爬虫爬取深圳租房信息的过程及遇到的问题

    为了分析深圳市所有长租.短租公寓的信息,爬取了某租房公寓网站上深圳区域所有在租公寓信息,以下记录了爬取过程以及爬取过程中遇到的问题: 爬取代码: import requests from reques ...

  9. python爬虫:找房助手V1.0-爬取58同城租房信息

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取 python免费学习资 ...

最新文章

  1. Deep learning的一些教程 (转载)
  2. android上下文关系,Android Context上下文的理解 Hua
  3. RedHat 6配置DNS服务实现主从同步与正反向解析
  4. 设计模式 分类和原则
  5. python3 Connection aborted.', RemoteDisconnected('Remote end closed connection without response'
  6. git两个账号切换_Git切换账号方法
  7. 第一场“直播相声”来了!罗永浩宣布独家签约抖音:不赚钱,交个朋友
  8. rockycapture_RockyCapture航线规划软件介绍文档
  9. WebStorm学习笔记002---grunt-watch插件的使用-修改html,css,js文件实现自动编译更新
  10. C/C++中函数指针的含义(转)
  11. FOSRestBundle功能包:概述
  12. Android 返回键的处理
  13. NodeJs之http
  14. linux shell $#获取所有参数的个数 $@获取所有参数
  15. Axure|【民宿】民宿APP原型
  16. SpringDataJpa原理及使用
  17. 你知道CDN是什么吗?本文带你搞明白CDN
  18. 如何用python制作动画电影_用Python制作3D动画
  19. 怪物之心无法触发_《异度神剑2》力男支线任务怪物之心流程介绍
  20. 微信小程序之微信登陆 —— 微信小程序教程系列(20)

热门文章

  1. ORAN传输封装类型
  2. mac系统升级导致VirtualBox报Kernel driver not installed (rc=-1908)
  3. 使用sklearn构建完整的回归项目(一)
  4. spss对数据进行聚类分析(系统聚类法和k-均值聚类法)和判别分析(费歇尔和贝叶斯)。
  5. 微商分销系统哪家好,要怎么做?
  6. 电商订单系统,你该如何设计
  7. JS 网页打印解决方案
  8. 计算机无法显示输入法怎么办,win7系统电脑输入法选项不见了导致无法输入中文怎么办...
  9. linux查看文件打开限制,Linux最大文件打开数使用经验详解
  10. vmbox 导入虚拟电脑之后无法上网