列表表达式爬取红牛分公司数据
列表达式爬取红牛官网分公司信息
import requests
import pandas as pd
import bs4
response = requests.get("http://www.redbull.com.cn/about/branch")
main_page = bs4.BeautifulSoup(response.text,"html.parser")
company = [i.text for i in main_page.findAll("h2")]
address = [i.text for i in main_page.findAll("p",attrs={"class":"mapIco"})]
code = [i.text for i in main_page.findAll("p",attrs={"class":"mailIco"})]
tel = [i.text for i in main_page.findAll("p",attrs={"class":"telIco"})]
df = pd.DataFrame({"company":company,"address":address,"code":code,"tel":tel})
df.to_excel(excel_writer="data/redbull_list.xlsx",index=None)
df.head()
运行结果:
列表表达式爬取红牛分公司数据相关推荐
- 正则表达式爬取红牛分公司数据
正则表达式还是很好玩的,爬取红牛官网分公司信息 import requests import re import pandas as pd response = requests.get(url=&q ...
- python--re模块及爬取红牛分公司实战演练
正则取消转义 正则器中取消转义推荐使用\(每个\只能取消一个字符的转义) 而python中取消转义推荐使用r'\n\a\t'(也可以使用\) python内置模块之re 引用方式:import re ...
- 简单爬取红牛分公司基本数据part01
简单爬取红牛分公司基本数据part01 此教程利用requests.re.pandas三个模块完成爬取. 导入模块: import requests import re import pandas获取 ...
- 红牛分公司数据part02
简单爬取红牛分公司基本数据part02 此教材利用requests.pandas.bs4三个模块. 代码实现如下: 方式一:直接在终端打印 import requests import pandas ...
- 用Scrapy爬虫框架爬取食品论坛数据并存入数据库
这篇文章主要给大家介绍了食品网站的数据采集和存储过程,详解了如何分析网页结构.爬虫策略.网站类型.层级关系.爬虫方法和数据存储过程,最终实现将帖子的每条评论爬取到数据库中,并且做到可以更新数据,防止重 ...
- Python 爬取北京二手房数据,分析北漂族买得起房吗?(附完整源码)
来源:CSDN 本文约3500字,建议阅读9分钟. 本文根据Python爬取了赶集网北京二手房数据,R对爬取的二手房房价做线性回归分析,适合刚刚接触Python&R的同学们学习参考. 房价高是 ...
- 对爬虫爬取到的数据进行存储
已写章节 第一章 网络爬虫入门 第二章 基本库的使用 第三章 解析库的使用 第四章 数据存储 第五章 动态网页的抓取 文章目录 已写章节 第四章 数据存储 4.1 文件存储 4.1.1 TXT文件存储 ...
- python 百度百科 爬虫_爬虫爬取百度百科数据
以前段时间<青春有你2>为例,我们使用Python来爬取百度百科中<青春有你2>所有参赛选手的信息. 什么是爬虫? 为了获取大量的互联网数据,我们自然想到使用爬虫代替我们完成这 ...
- 用 Python 爬取 4332 条数据,揭秘甜咸肉粽的江湖!
作者 | 朱小五 责编 | 屠敏 来源 | 凹凸数据 端午节快要到了,甜咸粽子之争也快要拉开帷幕. 本文准备用Python爬取淘宝上的粽子数据并进行分析,看看有什么发现. 注:本文仅用于学习交流,禁止 ...
最新文章
- 入手一个windows ce系统的可以打电话的HPC,测试在上面发表博客
- MySQL表名不区分大小写的设置方法
- boost::mp11::mp_count_if相关用法的测试程序
- c语言字符串文库总结,C语言程序设计入门:字符串函数
- java - 求最大公约数和最小公倍数
- Zookeeper——入门介绍(相关原理、安装启动及使用操作)
- 124_Power PivotPower BI DAX优化计算最大连续次数
- 猜拳游戏php代码,最常见的猜拳小游戏Android代码实现
- 作业2结对(升级版)
- ES 6理解 let
- Excel VBA实现 通过文件名查找全路径
- TCP连接建立与释放
- 调查 ESXi/ESX 上的虚拟机文件锁定 (10051)
- WEB-JSPELJSTL
- Severstal: Steel Defect Detection竞赛
- Ubuntu环境下XAMP安装PHP的rabbitmq扩展
- Python,海龟作图,闪避球小游戏
- IOS Crash信息收集
- HDUOJ 1069 Monkey and Banana
- 人像修图怎么修脸部瑕疵