python工商银行流水_python爬取银行名称和官网地址
话不多说直接上代码:
import re
from urllib import request
from urllib.request import urlopen
import pymysql as mysql
u = 'root'
p = 'root'
d = 'python'
sql = 'insert into bank_info values(%s,%s)'
url = 'http://www.cbrc.gov.cn/chinese/jrjg/index.html'
# 爬虫伪装浏览器步骤:
# 1. 定义一个真实浏览器的代理名称
myAgent = "Mozilla/5.0 (X11; Linux x86_64; rv:45.0) Gecko/20100101 Firefox/45.0" #这个是我当前火狐浏览器的信息
# 2.将代理写到请求页面的header里面去
myrequest = request.Request(url,headers={'User-Agent': myAgent} )
# 3. 打开网页, 获取内容
content = urlopen(myrequest).read().decode('utf-8')
# 获取对象:中国工商银行
pattern = r'
\s* \s*?([\S]*?)\s*?|\s*?([\S]*?)\s*?'
def main():
res = re.findall(pattern, content)
# [('http://www.hsbc.com.cn', '汇丰中国', ''), ...('', '', '蒙特利尔银行(中国)有限公司')...]
conn = mysql.connect(user=u, passwd=p, db=d, charset='utf8', autocommit=True)
cur = conn.cursor()
for info in res:
if info[0]:
info = info[1::-1] # 有官网
else:
info = info[:-3:-1] # 无官网
cur.execute(sql, (info[0],info[1]))
conn.commit()
if __name__ == "__main__":
main()
运行结果:
python工商银行流水_python爬取银行名称和官网地址相关推荐
- Python爬虫实战 | (1) 爬取猫眼电影官网的TOP100电影榜单
在本篇博客中,我们将使用requests+正则表达式来爬取猫眼电影官网的TOP100电影榜单,获取每部电影的片名,主演,上映日期,评分和封面等内容. 打开猫眼Top100,分析URL的变化:发现Top ...
- python爬虫实操|爬取nba中国官网球员数据
本次我们将爬取Ajax动态加载数据并进行简单数据分析,其主要方式是找到数据的json包,将其保存到本地目录,进行数据分析 文章目录 一.业务分析 二.步骤 1.找到数据 2.抓取数据 3.分析数据 总 ...
- Python爬虫之selenium爬取英雄联盟官网英雄皮肤图片下载到本地和保存到数据库
从英雄联盟皮肤网站的网页源代码中获取不到英雄的皮肤地址 通过selenium可以轻松获取想要的内容 源码展示 from selenium import webdriver from time impo ...
- Python爬虫之简单爬虫之爬取英雄联盟官网的英雄的皮肤
Python爬虫之简单爬虫之爬取英雄联盟官网的英雄的皮肤 文章目录 Python爬虫之简单爬虫之爬取英雄联盟官网的英雄的皮肤 背景:LOL这款游戏有着大量的玩家,这个游戏里面人们津津乐道的皮肤,每一款 ...
- python爬虫爬取王者荣耀官网全部英雄头像(源码分享)
这篇文章为源码分享,爬虫的分析过程请阅读文章 <用python爬取王者荣耀官网的英雄皮肤海报(含源码)> 源码 import requests import json from bs4 i ...
- python爬虫爬取王者荣耀官网全部装备图片(源码分享)
这篇文章为源码分享,爬虫的分析过程请阅读文章 <用python爬取王者荣耀官网的英雄皮肤海报(含源码)> 源码 import requests from bs4 import Beauti ...
- 【考公人的福利】Python爬取中公官网资料
[考公人的福利]Python爬取中公官网资料 一.简述 二.代码 三.运行结果 一.简述 写这个代码的目的是能够高效率提取中公官网的资料,例如:申论.行测.面试热点.公安基础知识等.大家可以根据个人需 ...
- python利用mysql数据库实现一个中英文翻译程序兼单词试卷生成并改阅功能,并可以爬取有道官网进行在线翻译。
直接上运行截图(代码在后面) 开始界面 使用navicat查看mysql数据库中的数据 单词查询功能测试 本地翻译一个本地数据库中有的单词 本地翻译一个本地数据库中没有的单词 爬取有道官网进行在线翻译 ...
- 爬取中国所有银行官网网址信息
爬取中国所有银行官网网址信息,并保存在文档中. from urllib import request from urllib.request import urlopen import re url ...
最新文章
- 如果中国要做自己的GPT-3,一定离不开这家公司的算力
- laravel中Request、Session、Response、Middelware
- NYOJ----776删除元素
- qu(判定操作序列)NOIP模拟 数据结构判断 模拟
- 【两种解法】基础实验4-2.2 列出叶结点 (25 分)
- opencv中匹配点对的坐标提取
- JQuery中常用方法备忘
- windows 改变用户文件路径(对所有新用户)
- 嘉善 机器人比赛_第十一届省青少年机器人大赛嘉善摆擂
- java五险一金去从工资扣吗,五险一金需要自己交钱吗?是从工资里扣除还是......
- 数据分析案例——销售利润不达标原因分析及应对策略
- 在有C语言的基础上,快速学习python(C语言转战python)(python3)
- 2013级C++第15周项目——二维数组
- 机器学习笔记 十七:基于Gini Importance、Permutation Importance、Boruta的随机森林模型重要性评估的比较
- js 负数转换正_js 负数转换成正数的方法
- 视频转mp3格式转换器怎么使用
- 电脑白屏,笔记本电脑白屏是怎么回事 笔记本电脑白屏解决方法【详解】
- 大数据使磁带重获新生
- egpu+mac+bootcamp
- 2014年最新720多套源码2.0GB免费一次性打包下载