话不多说直接上代码:

import re

from urllib import request

from urllib.request import urlopen

import pymysql as mysql

u = 'root'

p = 'root'

d = 'python'

sql = 'insert into bank_info values(%s,%s)'

url = 'http://www.cbrc.gov.cn/chinese/jrjg/index.html'

# 爬虫伪装浏览器步骤:

# 1. 定义一个真实浏览器的代理名称

myAgent = "Mozilla/5.0 (X11; Linux x86_64; rv:45.0) Gecko/20100101 Firefox/45.0" #这个是我当前火狐浏览器的信息

# 2.将代理写到请求页面的header里面去

myrequest = request.Request(url,headers={'User-Agent': myAgent} )

# 3. 打开网页, 获取内容

content = urlopen(myrequest).read().decode('utf-8')

# 获取对象:中国工商银行

pattern = r'

\s* \s*?([\S]*?)\s*?|\s*?([\S]*?)\s*?'

def main():

res = re.findall(pattern, content)

# [('http://www.hsbc.com.cn', '汇丰中国', ''), ...('', '', '蒙特利尔银行(中国)有限公司')...]

conn = mysql.connect(user=u, passwd=p, db=d, charset='utf8', autocommit=True)

cur = conn.cursor()

for info in res:

if info[0]:

info = info[1::-1] # 有官网

else:

info = info[:-3:-1] # 无官网

cur.execute(sql, (info[0],info[1]))

conn.commit()

if __name__ == "__main__":

main()

运行结果:

python工商银行流水_python爬取银行名称和官网地址相关推荐

  1. Python爬虫实战 | (1) 爬取猫眼电影官网的TOP100电影榜单

    在本篇博客中,我们将使用requests+正则表达式来爬取猫眼电影官网的TOP100电影榜单,获取每部电影的片名,主演,上映日期,评分和封面等内容. 打开猫眼Top100,分析URL的变化:发现Top ...

  2. python爬虫实操|爬取nba中国官网球员数据

    本次我们将爬取Ajax动态加载数据并进行简单数据分析,其主要方式是找到数据的json包,将其保存到本地目录,进行数据分析 文章目录 一.业务分析 二.步骤 1.找到数据 2.抓取数据 3.分析数据 总 ...

  3. Python爬虫之selenium爬取英雄联盟官网英雄皮肤图片下载到本地和保存到数据库

    从英雄联盟皮肤网站的网页源代码中获取不到英雄的皮肤地址 通过selenium可以轻松获取想要的内容 源码展示 from selenium import webdriver from time impo ...

  4. Python爬虫之简单爬虫之爬取英雄联盟官网的英雄的皮肤

    Python爬虫之简单爬虫之爬取英雄联盟官网的英雄的皮肤 文章目录 Python爬虫之简单爬虫之爬取英雄联盟官网的英雄的皮肤 背景:LOL这款游戏有着大量的玩家,这个游戏里面人们津津乐道的皮肤,每一款 ...

  5. python爬虫爬取王者荣耀官网全部英雄头像(源码分享)

    这篇文章为源码分享,爬虫的分析过程请阅读文章 <用python爬取王者荣耀官网的英雄皮肤海报(含源码)> 源码 import requests import json from bs4 i ...

  6. python爬虫爬取王者荣耀官网全部装备图片(源码分享)

    这篇文章为源码分享,爬虫的分析过程请阅读文章 <用python爬取王者荣耀官网的英雄皮肤海报(含源码)> 源码 import requests from bs4 import Beauti ...

  7. 【考公人的福利】Python爬取中公官网资料

    [考公人的福利]Python爬取中公官网资料 一.简述 二.代码 三.运行结果 一.简述 写这个代码的目的是能够高效率提取中公官网的资料,例如:申论.行测.面试热点.公安基础知识等.大家可以根据个人需 ...

  8. python利用mysql数据库实现一个中英文翻译程序兼单词试卷生成并改阅功能,并可以爬取有道官网进行在线翻译。

    直接上运行截图(代码在后面) 开始界面 使用navicat查看mysql数据库中的数据 单词查询功能测试 本地翻译一个本地数据库中有的单词 本地翻译一个本地数据库中没有的单词 爬取有道官网进行在线翻译 ...

  9. 爬取中国所有银行官网网址信息

    爬取中国所有银行官网网址信息,并保存在文档中. from urllib import request from urllib.request import urlopen import re url ...

最新文章

  1. 如果中国要做自己的GPT-3,一定离不开这家公司的算力
  2. laravel中Request、Session、Response、Middelware
  3. NYOJ----776删除元素
  4. qu(判定操作序列)NOIP模拟 数据结构判断 模拟
  5. 【两种解法】基础实验4-2.2 列出叶结点 (25 分)
  6. opencv中匹配点对的坐标提取
  7. JQuery中常用方法备忘
  8. windows 改变用户文件路径(对所有新用户)
  9. 嘉善 机器人比赛_第十一届省青少年机器人大赛嘉善摆擂
  10. java五险一金去从工资扣吗,五险一金需要自己交钱吗?是从工资里扣除还是......
  11. 数据分析案例——销售利润不达标原因分析及应对策略
  12. 在有C语言的基础上,快速学习python(C语言转战python)(python3)
  13. 2013级C++第15周项目——二维数组
  14. 机器学习笔记 十七:基于Gini Importance、Permutation Importance、Boruta的随机森林模型重要性评估的比较
  15. js 负数转换正_js 负数转换成正数的方法
  16. 视频转mp3格式转换器怎么使用
  17. 电脑白屏,笔记本电脑白屏是怎么回事 笔记本电脑白屏解决方法【详解】
  18. 大数据使磁带重获新生
  19. egpu+mac+bootcamp
  20. 2014年最新720多套源码2.0GB免费一次性打包下载

热门文章

  1. sudo rm-rf引发的惨案——Linux硬盘的分区和挂载
  2. EF6 T4 Model.TT文件的修改-自动加上注释
  3. TDA4VM中各个CPU对应的名字
  4. 基于Redis的限流器的实现
  5. July 16th 模拟赛C T2 奶牛晒衣服 Solution
  6. windows下服务或SYSTEM权限读取当前用户注册表HKEY_CURRENT_USER
  7. 基于go语言搭建高性能IM系统
  8. 如何在ps中添加图片上的塑料布效果
  9. Modularity(模块化)
  10. 如何用C#+WinRAR 实现压缩