python工商银行流水_python爬取银行名称和官网地址

话不多说直接上代码：

import re

from urllib import request

from urllib.request import urlopen

import pymysql as mysql

u = 'root'

p = 'root'

d = 'python'

sql = 'insert into bank_info values(%s,%s)'

url = 'http://www.cbrc.gov.cn/chinese/jrjg/index.html'

# 爬虫伪装浏览器步骤：

# 1. 定义一个真实浏览器的代理名称

myAgent = "Mozilla/5.0 (X11; Linux x86_64; rv:45.0) Gecko/20100101 Firefox/45.0" #这个是我当前火狐浏览器的信息

# 2.将代理写到请求页面的header里面去

myrequest = request.Request(url,headers={'User-Agent': myAgent} )

# 3. 打开网页，获取内容

content = urlopen(myrequest).read().decode('utf-8')

# 获取对象：中国工商银行

pattern = r'

\s* \s*?([\S]*?)\s*?|\s*?([\S]*?)\s*?'

def main():

res = re.findall(pattern, content)

# [('http://www.hsbc.com.cn', '汇丰中国', ''), ...('', '', '蒙特利尔银行(中国)有限公司')...]

conn = mysql.connect(user=u, passwd=p, db=d, charset='utf8', autocommit=True)

cur = conn.cursor()

for info in res:

if info[0]:

info = info[1::-1] # 有官网

else:

info = info[:-3:-1] # 无官网

cur.execute(sql, (info[0],info[1]))

conn.commit()

if __name__ == "__main__":

main()

运行结果：

python工商银行流水_python爬取银行名称和官网地址相关推荐

Python爬虫实战 | (1) 爬取猫眼电影官网的TOP100电影榜单
在本篇博客中,我们将使用requests+正则表达式来爬取猫眼电影官网的TOP100电影榜单,获取每部电影的片名,主演,上映日期,评分和封面等内容. 打开猫眼Top100,分析URL的变化:发现Top ...
python爬虫实操|爬取nba中国官网球员数据
本次我们将爬取Ajax动态加载数据并进行简单数据分析,其主要方式是找到数据的json包,将其保存到本地目录,进行数据分析文章目录一.业务分析二.步骤 1.找到数据 2.抓取数据 3.分析数据总 ...
Python爬虫之selenium爬取英雄联盟官网英雄皮肤图片下载到本地和保存到数据库
从英雄联盟皮肤网站的网页源代码中获取不到英雄的皮肤地址通过selenium可以轻松获取想要的内容源码展示 from selenium import webdriver from time impo ...
Python爬虫之简单爬虫之爬取英雄联盟官网的英雄的皮肤
Python爬虫之简单爬虫之爬取英雄联盟官网的英雄的皮肤文章目录 Python爬虫之简单爬虫之爬取英雄联盟官网的英雄的皮肤背景:LOL这款游戏有着大量的玩家,这个游戏里面人们津津乐道的皮肤,每一款 ...
python爬虫爬取王者荣耀官网全部英雄头像(源码分享)
这篇文章为源码分享,爬虫的分析过程请阅读文章 <用python爬取王者荣耀官网的英雄皮肤海报(含源码)> 源码 import requests import json from bs4 i ...
python爬虫爬取王者荣耀官网全部装备图片(源码分享)
这篇文章为源码分享,爬虫的分析过程请阅读文章 <用python爬取王者荣耀官网的英雄皮肤海报(含源码)> 源码 import requests from bs4 import Beauti ...
【考公人的福利】Python爬取中公官网资料
[考公人的福利]Python爬取中公官网资料一.简述二.代码三.运行结果一.简述写这个代码的目的是能够高效率提取中公官网的资料,例如:申论.行测.面试热点.公安基础知识等.大家可以根据个人需 ...
python利用mysql数据库实现一个中英文翻译程序兼单词试卷生成并改阅功能，并可以爬取有道官网进行在线翻译。
直接上运行截图(代码在后面) 开始界面使用navicat查看mysql数据库中的数据单词查询功能测试本地翻译一个本地数据库中有的单词本地翻译一个本地数据库中没有的单词爬取有道官网进行在线翻译 ...
爬取中国所有银行官网网址信息
爬取中国所有银行官网网址信息,并保存在文档中. from urllib import request from urllib.request import urlopen import re url ...

python工商银行流水_python爬取银行名称和官网地址

python工商银行流水_python爬取银行名称和官网地址相关推荐

最新文章

热门文章