#!/usr/bin/env python3
# -*- coding: utf-8 -*-
# Author;Tsukasaimport requests
from bs4 import BeautifulSoup
import pandas
import timeurl_all = []
url_in = input('输入你所需要城市的字母简写:\n如:中山 zs , 广州 gz\n!!!不要乱输入,不然运行不了')
url_number = 1+int(input('输入爬取页数:'))okl = []
def open(nobe):res = requests.get(nobe)soup = BeautifulSoup(res.text,'html5lib')http_start = []url_start = 'http://esf.'+url_in+'.fang.com'for title in soup.select('.houseList dl'):  #网址链接列表url_end = title.select('.title a ')[0]['href']http_start.append(url_start + url_end)return http_start#获取详细信息
def content(url):info = {}info['网页'] = urlres = requests.get(url)soup = BeautifulSoup(res.text,'html5lib')info['标题'] = soup.select('h1')[0].text.strip()  #获取标题info['总价'] = soup.select('.red20b')[0].text + '万'   #总价info['联系电话'] = soup.select('#mobilecode')[0].text   #电话for sl in soup.select('span'):  #获取发布时间if '发布时间' in sl.text.lstrip('<span>'):key , value = (sl.text.strip().rstrip('(').split(':'))info[key] = value + '*' + soup.select('#Time')[0].textfor dd in soup.select('dd'):  #获取详细内容if ':' in dd.text.strip():key , value = (dd.text.strip().split(':'))info[key] = valuereturn infoprint('----------正在运行,请不要关闭----------')
url_home = ('http://esf.'+ url_in + '.fang.com/house/i3{}/')
for url_next in range(1,url_number):url_all.append((url_home.format(url_next)))home = []
for i in url_all:a = (open(i))print('正在获取 -----> ',i,' <-----')time.sleep(1)for b in a:home.append(content(b))print('\t正在获取详细信息 -> ',b,' <-----')time.sleep(2)#home.append(content(open(i[0])))
last = pandas.DataFrame(home)
last.to_excel('temp.xlsx',sheet_name='房源信息')
print('----------运行结束----------\n\n----------查看根目录---------')abcdefg = input('完成运行')

  源码先奉上,以后在填坑

转载于:https://www.cnblogs.com/Tsukasa/p/6721026.html

python3 爬虫之爬取安居客二手房资讯(第一版)相关推荐

  1. 爬虫项目--爬取安居客二手房信息

    爬虫实战(爬取安居客二手房信息-成都天府新区) 环境:python3.6 pycharm bs4库 解析方式:bs4 需求:爬取二手房信息字段(titile,house_type,build_time ...

  2. 使用Python爬取安居客二手房房价数据

    作为一个Python新手,公司突然安排我爬取房价数据,真让人有点头大啊!幸好网上的大佬们经验丰富,给予了很多代码上的帮助.本文代码在网友pythoner111爬虫项目–爬取安居客二手房信息的基础上修改 ...

  3. python爬取房源数据_python爬取安居客二手房网站数据(实例讲解)

    是小打小闹 哈哈,现在开始正式进行爬虫书写首先,需要分析一下要爬取的网站的结构:作为一名河南的学生,那就看看郑州的二手房信息吧! 在上面这个页面中,我们可以看到一条条的房源信息,从中我们发现了什么,发 ...

  4. bs4+phantomjs爬取安居客二手房信息

    bs4+phantomjs爬取安居客二手房信息 这是我的第一篇博客,希望通过养成写博客的习惯来督促自己学习. 开发环境以及需要安装的模块 - Python3.6 - requests pip inst ...

  5. 爬虫爬取安居客二手房和新房信息,你是买新房还是二手的呢?

    本文主要讲解爬取安居客买房类别中的二手房和新房,将提取的信息存储在记事本中,也可以转存CSV格式或者MongoDB中. 网站HTML信息提取比较简单,没有什么特别的地方,作为爬虫入门可以让初学者快速了 ...

  6. python爬取安居客二手房网站数据(转)

    之前没课的时候写过安居客的爬虫,但那也是小打小闹,那这次呢, 还是小打小闹 哈哈,现在开始正式进行爬虫书写 首先,需要分析一下要爬取的网站的结构: 作为一名河南的学生,那就看看郑州的二手房信息吧! 在 ...

  7. python爬取安居客二手房网站数据

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取 python免费学习资 ...

  8. python3 beautiful爬取安居客的二手房信息

    今天有一位同学找我爬取安居客的信息,安居客网站有反爬虫机制,所以不能简单用requests来做,这里用selenium来模拟获取url网页. 环境 mac, python3.7 beautifulso ...

  9. Python开发爬虫之BeautifulSoup解析网页篇:爬取安居客网站上北京二手房数据

    目标:爬取安居客网站上前10页北京二手房的数据,包括二手房源的名称.价格.几室几厅.大小.建造年份.联系人.地址.标签等. 网址为:https://beijing.anjuke.com/sale/ B ...

最新文章

  1. WMI技术介绍和应用——查询正在运行的进程信息
  2. Histogram of Oriented Gridients(HOG) 方向梯度直方图
  3. 我眼中的Linux设备树(一 概述)
  4. hdoj 1004 学习思路
  5. 2019,国产手机生死存亡的一年
  6. wget命令下载文件并另存为不同的文件名
  7. Struts原理、开发及项目实施
  8. 【项目管理】项目管理发展的新阶段——PRINCE2项目管理方法
  9. mysql中str_to_date函数和date_format函数和now函数
  10. 磁盘管理看不到硬盘的恢复办法
  11. (bat)检查今天星期几,并执行程序
  12. 计算机网络---网络层
  13. 【《关于我一个小学生用C++写了个抽奖游戏这件事》】
  14. Ambari-2.7.5.0 + HDP-3.1.5.0网盘地址
  15. 中科院涉及集成电路(芯片)的院所
  16. 谭八爷系统模式的探讨
  17. pytorch:交叉熵(cross entropy)
  18. HTTP请求和相应格式
  19. 电网络节点电压matlab,电力网潮流电压计算例题与matlab程序
  20. 数学竞赛辅导陈启浩pdf_2020年数学建模竞赛备赛利器送你

热门文章

  1. Fastadmin管理Mysql_Fastadmin笔记
  2. 在西门子S7-200中一步步做库文件
  3. 科技早闻:传科比将成苹果iWatch代言人
  4. 【python实战】top3 英尺转换为米
  5. nextJs 跨域访问接口数据
  6. 使用红外传感器和Arduino制作数字转速表测量RPM
  7. tensorflow2常用语句(实战)
  8. Matlab机器人工具箱(0)——旋转与平移变换
  9. 2021年机械员-通用基础(机械员)考试总结及机械员-通用基础(机械员)复审考试
  10. migrate快速学习