初学,代码有点烂,有些错误先不处理。

#!/usr/bin/python
# -*- coding: <encoding name> -*-import requests
from bs4 import BeautifulSoup
from openpyxl import Workbookwb = Workbook()
ws = wb.active
ws.append(['序号','楼盘名称', '面积', '价格','地址'])
# wb.save("e:sample.xlsx")headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.77 Safari/537.36'
}# 定义楼盘的各项信息列表,便于进行数据追加保存
name_list = []
price_list = []
area_list = []
add_list = []i = 1
pagenum = input('请输入要抓取<楼盘网>多少页的数据:')# 通过循环,设定pagenum数值来抓取多少页的楼盘数据
while i <= int(pagenum):url = 'http://fs.loupan.com/xinfang/p'+str(i)res = requests.get(url,headers = headers)print('第>>>>>  '+ str(i) + '  <<<<<页数据抓取完毕!!' ) # 打印抓取页面的进程res.encoding = res.apparent_encodingsoup = BeautifulSoup(res.text,'html.parser')# 获取楼盘名字,并追加保存在name_list列表中name = soup.find_all('h3')for a in name:name_list.append(a.text)# 获取楼盘面积大小,并追加保存在area_list列表中area = soup.find_all(class_="type")for a in area:area_list.append(a.text)# 获取楼盘地址,并追加保存在add_list列表中add = soup.find_all(class_="add")for a in add:add_list.append(a.text)# 获取楼盘价格,并追加保存在price_list列表中price = soup.find_all('li',class_="price")for b in price:price_list.append(b.text)i += 1x = 0
y = 27 # 每一页有27个楼盘信息需要爬取,进行for循环不要超出。并通过append一行一行将楼盘信息保存到Excel表格中
while x < y*(i-1):ws.append([str(x+1),name_list[x],area_list[x],price_list[x],add_list[x]])x += 1wb.save("e:sample.xlsx") # 将文件存盘

爬取楼盘网并将数据保存在excel表中相关推荐

  1. 爬取豆瓣电影 Top250 电影并存储到 Excel 表中

    文章目录 一.前期准备 二.代码 一.前期准备 观察网页 url 或者通过最下面的分页审查元素: 发现规律,0-25-50...递增,以此确定爬取 page 页码 确定爬取的内容 名称.图片.排名.评 ...

  2. 爬取东方财富网股票行情数据和资讯

    爬取东方财富网股票行情数据和资讯 这个需求源于我的一个练手项目 本篇博客参考:https://zhuanlan.zhihu.com/p/50099084 该博客介绍的东西本博客不做论述 使用技术: 语 ...

  3. python爬取火车票网的时刻表数据

    python爬取火车票网的时刻表数据 导包 import re,requests,datetime,time,json from prettytable import PrettyTable from ...

  4. python二手房价格预测_Python爬取赶集网北京二手房数据R对爬取的二手房房价做线性回归分析...

    前言:本文主要分为两部分:Python爬取赶集网北京二手房数据&R对爬取的二手房房价做线性回归分析.文章思路清晰,代码详细,特别适合刚刚接触Python&R的同学学习参考. Part1 ...

  5. Python爬取中国大学排名,并且保存到excel中

    前言 以下文章来源于数据分析和Python ,作者冈坂日川 今天发的是python爬虫爬取中国大学排名,并且保存到excel中,当然这个代码很简单,我用了半小时就写完了,我的整体框架非常清晰,可以直接 ...

  6. python爬取沪深所有股票数据并生成Excel文件

    爬取沪深所有股票数据并生成Excel文件 一.分析需求 1.对于沪深两市的各只股票,获取其:'股票代码', '股票名称', '最高', '最低', '涨停', '跌停', '换手率', '振幅', ' ...

  7. Python爬取URP教务系统课程表并保存到excel

    Python爬取URP教务系统课程表并保存到excel 爬取URP教务系统课程表最终结果如图所示: 接下来开始操作: 首先打开教务系统->按F12->点击Network->刷新一下界 ...

  8. bs4主要知识点介绍及实例解析---利用bs4爬取伯乐在线(分别存储在数据库和xls表中)

    bs4主要知识点介绍及实例讲解 bs4 是第三方解析html数据的包 from bs4 import BeautifulSoup lxml 解析读取html的第三方解释器,解析速度快,底层通过c实现 ...

  9. asp.net学习笔记·将数据库中的数据保存在EXCEL文件中

    提取数据库中的数据,将其保存在EXCEL文件中,并提供下载. 在一般处理程序中将数据库数据保存在EXCEL文件中的代码 using System; using System.Collections.G ...

最新文章

  1. 2022-2028年中国内衣行业研究及前瞻分析报告
  2. python计算两个字典的相同点(从key、value、item角度)
  3. 关于安徽赛区推广校赛的实施办法
  4. opencv7-ml之svm
  5. 初识mysql学习笔记
  6. mac上的mysql管理工具sequel pro
  7. 【HTML】建站成功默认页面
  8. oracle在linux上使用裸设备,在linux下构建基于LVM的裸设备数据库
  9. 针对xml文件做提取与写入的操作
  10. Cover团队在Kovan以太坊测试网部署xCOVER智能合约
  11. 【计算机网络笔记】数据链路层:点对点协议PPP
  12. 2018CCPC网络赛 HDU 6444: G. Neko's loop(线段树)
  13. mysql lock not wait_【MySQL】关于MySQL出现lock wait timeout exceeded 的解决方案
  14. Java学习笔记——判断一个数是否是质数
  15. [转]Python中找出dataframe中的重复的行 DataFrame.duplicated()方法
  16. .c和.h文件的区别
  17. Cognos问题解决
  18. 树莓派无显示器连接无线
  19. vs2008编译QT开源项目--太阳神三国杀源码分析(三) 皮肤
  20. 没有选择的选择才能坚持和专注

热门文章

  1. 从拼多多解析社交电商
  2. 基于上下文的业务流建模法(二)
  3. 香港虚拟主机空间哪个好?
  4. 苹果手机滑动光标怎么设置_苹果手机移动的光标怎么设置出来
  5. 解决Win7缺失MSVCR120.DLL问题
  6. 【魔店】拼多多店群玩法是什么?如何运营店铺?
  7. 稀里糊涂的准备开始了……
  8. 硬盘数据恢复的原理是什么?清空、格式化数据真的就没有了吗?
  9. AWS 云从业者认证(AWS Certified Cloud Practitioner)
  10. ImageWatch无法显示图像