网址:苏州短租房,苏州日租房,苏州短租公寓-游天下苏州短租站

导入库

from bs4 import BeautifulSoup
import requests

请求网页

url = 'http://www.youtx.com/suzhou/'
headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.122 Safari/537.36'}
res = requests.get(url,headers=headers)res.status_code
html=res.text
soup=BeautifulSoup(html,'lxml')
soupsoup.find_all('div',attrs={'class':'houseInfo clearfix'})

爬取一家店铺

one=soup.find_all('div',attrs={'class':'house-tit clearfix'})[0]
one#名称
name=(''.join(one.find('a').contents))   #contents为列表需用(''.join)转为字符串
name      #方法1
one.find('a').attrs['title']   #方法2#照片
photo=soup.find_all('div',attrs={'class':'house-img'})[0].find('a').attrs['href']
phototwo=soup.find_all('div',attrs={'class':'houseInfo-left mt2'})[0]
two#地址
address=(''.join(two.find_all('p')[0].contents[0]))
address#备注
beizhu=(''.join(two.find_all('p')[1].contents[0]))
beizhu   #方法1
soup.find_all('div',attrs={'class':'houseInfo-left mt2'})[0].find_all('p')[1].contents[0]  #方法2#价格
price=(''.join(soup.find_all('span',attrs={'class':'housePrice'})[0].contents))
price

加循环 多家店铺

#建立空列表
photo=[]
name=[]
address=[]
beizhu=[]
price=[]urls=[]#加循环
for i in range(7):urls.append('http://www.youtx.com/suzhou/page'+str(i+1))
urls
#全部代码
for url in urls:response=requests.get(url,headers=headers)re=response.textsoup=BeautifulSoup(re,'lxml')a=soup.find_all('li',attrs={'class':'clearfix'})for i in range(len(a)-6):   #特别注意a一页有36个 真实值是30个photo=soup.find_all('div',attrs={'class':'house-img'})[i].find('a').attrs['href']one=soup.find_all('div',attrs={'class':'house-tit clearfix'})[i]name.append(''.join(one.find('a').attrs['title']))two=soup.find_all('div',attrs={'class':'houseInfo-left mt2'})[i]address.append(''.join(two.find_all('p')[0].contents[0]))beizhu.append(''.join(two.find_all('p')[1].contents[0]))price.append(''.join(soup.find_all('span',attrs={'class':'housePrice'})[i].contents))

放入列表中

import pandas as pd
df=pd.DataFrame({'photo':photo,'name':name,'address':address,'beizhu':beizhu,'price':price})

导出数据

df.to_excel("苏州短租.xlsx")  #导出数据

以下是代码截图

python爬取游天下苏州短租网数据(bs4)相关推荐

  1. python爬百度翻译-Python爬取百度翻译(利用json提取数据)

    本篇文章给大家带来的内容是关于Python爬取百度翻译(利用json提取数据),有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助. 工具:Python 3.6.5.PyCharm开发工具. ...

  2. 4ye含泪用python爬取了自己的公众号粉丝数据

    4ye含泪用python爬取了自己的公众号粉丝数据 小伙伴们好呀,最近本来是在捣鼓Gateway的知识点的,结果被一件事情搞得心不在焉 哈哈哈哈,结果不得不先鸽下~ 搞完这件事情再继续哦!! ε=ε= ...

  3. 利用Python爬取《囧妈》豆瓣短评数据,并进行snownlp情感分析

    利用Python爬取<囧妈>豆瓣短评数据,并进行snownlp情感分析 一.电影评论爬取 今年的贺岁片<囧妈>上映前后,在豆瓣评论上就有不少网友发表了自己的观点,到底是好评的声 ...

  4. 表哥用Python爬取数千条淘宝商品数据后,发现淘宝这些潜规则!

    本文记录了笔者用 Python 爬取淘宝某商品的全过程,并对商品数据进行了挖掘与分析,最终得出结论. 项目内容 本案例选择商品类目:沙发. 数量:共 100 页  4400 个商品. 筛选条件:天猫. ...

  5. Python爬取影评并进行情感分析和数据可视化

    Python爬取影评并进行情感分析和数据可视化 文章目录 Python爬取影评并进行情感分析和数据可视化 一.引言 二.使用requests+BeautifulSoup进行影评的爬取 1.分析界面元素 ...

  6. 刚刚用python爬取一千个微信朋友圈数据,他们的秘密原来这么多。

    当下我们饮食起居基本上依靠微信,但微信不单单是1个即时通信软件,更像是仿真模拟的日常生活世界.你所处的微信朋友圈是咋样,慢慢地你的思想也会变的咋样.近几日在学习 itchat,并且写了1个网络爬虫,扒 ...

  7. 详解Python爬取房天下的推荐新楼盘

    点击上方"程序员大咖",选择"置顶公众号" 关键时刻,第一时间送达! 最近一直在关注Python写爬虫相关的知识,尝试了采用requests + Beautif ...

  8. python 怎么爬桌软件数据_如何利用Python爬取并分析红岭创投的数据?

    第一步:爬取数据 通过 selenium + Firefox 的无头模式将需要的数据爬取出来,代码实现不在赘述,详细步骤可查看我的上一篇图文(如何利用Python爬取网易新闻), 由于 seleniu ...

  9. Python爬取《隐秘的角落》弹幕数据,实现简单可视化(附源码)

    工具使用 开发环境: win10.python3.6 开发工具: pycharm 相关模块 : requests,stylecloud 思路分析 1.爬虫获取数据 爱奇艺的弹幕数据是以 .z 形式的压 ...

最新文章

  1. 腾讯 AI Lab副主任俞栋:过去两年基于深度学习的声学模型进展
  2. GNU parted的指令說明[转]
  3. 【Windows 逆向】OD 调试器工具 ( CE 工具通过查找访问的方式找到子弹数据基地址 | 使用 OD 工具附加游戏进程 | 在 OD 工具中查看子弹数据地址 | 推荐 )
  4. hdu2100(大数加)
  5. java中动态代理实现机制
  6. 配置arm-linux-gcc 位置
  7. 申请了团队blog,不知道能否给开通
  8. 权限控制的两种主要方式详述
  9. e3是合法浮点数吗_下面4个选项中,均是合法浮点数的选项是?
  10. 时至今日,百度无人车还好吗?
  11. -bash: mysql: command not found
  12. linux安装雅黑字体,在CentOS系统中安装雅黑字体
  13. scienceWord总结
  14. gflags 调试内存_windows下堆异常调试神器--gflags
  15. 解决 Could not find common.jar (android.arch.core:common:1.0.0). 错误
  16. 小黄鸡QQ空间自动回复机器人
  17. 因为相信所以看见,既然看见注定坚信《17》
  18. 20个非常有趣的网站,挺有意思。
  19. revit二次开发--异形柱翻模
  20. 【苹果相册推送位置推送iMessage】软件安装TestFlight计划的信息

热门文章

  1. NSIS:静默释放文件并运行 制作绿色单文件软件
  2. 尚硅谷谷粒商城第五天 分类、规格、商品增删改查
  3. 【图片新闻】用于运送士兵和物品的“灰熊”坦克机器人
  4. Linux kernal
  5. pwm波如何控制电机代码_【附代码】日本工程师带你easy电机矢量控制
  6. php新闻网页 毕设,【优质源码】校园新闻发布系统 php+mysql 毕设程序
  7. ABTEST平台建设思路与方案
  8. 精灵图 SEO ico图标
  9. 微信小程序 发布新版本后 强制升级
  10. 【AT91SAM9261EK】 编译运行Linux Kernel 2.6.39