正则表达式还是很好玩的,爬取红牛官网分公司信息

import requests
import re
import pandas as pd
response = requests.get(url="http://www.redbull.com.cn/about/branch")
company = re.findall('<h2>(.*?)</h2>', response.text)
add = re.findall("<p class=\'mapIco\'>(.*?)</p>", response.text)
mail = re.findall("<p class=\'mailIco\'>(.*?)</p>",response.text)
tel = re.findall("<p class=\'telIco\'>(.*?)</p>",response.text)
df =pd.DataFrame({'company':company,'add':add,'mail':mail,'tel':tel})
df.to_excel(excel_writer="data/redbull_re.xlsx",index=None)
df.head()

爬取结果

正则表达式爬取红牛分公司数据相关推荐

  1. 列表表达式爬取红牛分公司数据

    列表达式爬取红牛官网分公司信息 import requests import pandas as pd import bs4 response = requests.get("http:// ...

  2. python--re模块及爬取红牛分公司实战演练

    正则取消转义 正则器中取消转义推荐使用\(每个\只能取消一个字符的转义) 而python中取消转义推荐使用r'\n\a\t'(也可以使用\) python内置模块之re 引用方式:import re ...

  3. 简单爬取红牛分公司基本数据part01

    简单爬取红牛分公司基本数据part01 此教程利用requests.re.pandas三个模块完成爬取. 导入模块: import requests import re import pandas获取 ...

  4. python+正则表达式爬取京东商品数据信息

    爬取数据的方式有很多种,正则表达式,scrapy,从接口中爬取动态网页的数据-今天我们讲的是用正则表达式来爬取京东一个大米商品的具体信息. 正则表达式的优点:可以精准的爬取我们想要的数据信息 缺点:爬 ...

  5. 红牛分公司数据part02

    简单爬取红牛分公司基本数据part02 此教材利用requests.pandas.bs4三个模块. 代码实现如下: 方式一:直接在终端打印 import requests import pandas ...

  6. 使用正则表达式爬取数据

    1.使用urllib.request 示例1:直接获取所有数据 [注]在Python3中包urllib2归入了urllib中,所以要导入urllib.request,并且要 把urllib2替换成ur ...

  7. Python 爬取北京二手房数据,分析北漂族买得起房吗?(附完整源码)

    来源:CSDN 本文约3500字,建议阅读9分钟. 本文根据Python爬取了赶集网北京二手房数据,R对爬取的二手房房价做线性回归分析,适合刚刚接触Python&R的同学们学习参考. 房价高是 ...

  8. 爬虫从头学之Requests+正则表达式爬取猫眼电影top100

    爬取思路 当我们想要爬取一个页面的时候,我们要保证思路清晰,爬虫的思路分四个步骤,发起请求,获取响应内容,解析内容,存储内容.根据这四个内容我们的思路就很清晰.以下为具体步骤 使用requests库爬 ...

  9. Python爬取热搜数据之炫酷可视化

    可视化展示 看完记得点个赞哟 炫酷可视化音乐组合版来了! 项目介绍 背景 现阶段.抖音.快手.哗哩哗哩.微信公众号已经成为不少年轻人必备的"生活神器".在21世纪的今天,你又是如何 ...

最新文章

  1. github充当服务器_如何创建充当链接HTML按钮
  2. 使用MLeaksFinder检测项目内存泄露总结
  3. QQ协议分析及其还原(一)
  4. c/c++ new delete初探
  5. BugkuCTF-MISC题想蹭网先解开密码
  6. Kinaba及X-Pack插件安装
  7. Python爬虫-《神雕侠侣》
  8. Mac 的 Adobe Creative Cloud 无法连接至服务器的解决办法?
  9. slub分配流程-kmem_cache_alloc函数
  10. 【论文翻译】Image Super-Resolution Using Deep Convolutional Networks
  11. python+Ocr.dll 突破搜狗站长网址推送验证码
  12. 2020图灵奖颁给“龙书”两位作者!合作数十年,他们让计算机读懂码农代码
  13. LCD显示异常分析——撕裂(tear effect)
  14. 教你如何看懂体检报告
  15. LiveQing云平台直播点播流媒体服务-产品介绍及相关资源
  16. DE2-115 SDRAM地址问题
  17. 怎么判断滤波器的低通、高通和带通?
  18. EasyDl快速上手教程
  19. 平面度、 共面度、 翘曲度三者区别
  20. ThinkPad X270 升级固态硬盘(M2 2242 NVMe)

热门文章

  1. RV1126 Linux 以太网MAC PHY 芯片8201f gmac dts配置
  2. EN 10088 1.4006(X12Cr13)马氏体不锈钢硬度
  3. 安卓开发 应用下载代码
  4. 使用多线程实现多客户端的连接(通过Socket实现TCP编程)
  5. eclipse 上传代码到github,我花费了一个月测的。就这样了
  6. 100+大数据开源处理工具汇总
  7. 【Flutter】利用nfc_manager 读取NFC交通卡信息
  8. win7连接sftp_WinSCP(SFTP客户端)官方版下载_WinSCP(SFTP客户端) v5.17.7.10640中文版 - Win7旗舰版...
  9. upload.js 文件图片上传
  10. 深信服科技公司2008校园招聘笔试题