爬取中国所有银行官网网址信息

爬取中国所有银行官网网址信息,并保存在文档中。

from urllib import request

from urllib.request import urlopen
import re
url = 'http://www.cbrc.gov.cn/chinese/jrjg/index.html'
def get_file_content(filName):
    with open('bank.txt') as f:
        return f.read().replace('\t', '')
def pattern_html():
    content = get_file_content('bank.txt')
    # < a href = "https://www.sc.com/cn/" target = "_blank" style = "color:#08619D">渣打银行</a>
    pattern1 = r'<a href="(https?://.+|www.+)" target="_blank" style="color:#08619D">\s*(.+)'
    bank_li1 = re.findall(pattern1, content)
    return bank_li1
def write_to_file(filename, bank_li):
    with open(filename, 'w') as f:
        f.write("银行名称\tURL\n")
        for url,name in bank_li:
            f.write("%s\t%s\n" %(name.strip(), url))
    print("写入成功!")
bank_li = pattern_html()
for ur, name in bank_li:
    print(ur, '\t', name)
write_to_file('bank1.txt', bank_li)

爬取中国所有银行官网网址信息相关推荐

Node 插件爬取王者荣耀官网英雄信息，并生成数据库
文章结构打开官网看接口地址打开官网游戏资料里的英雄资料,并打开后台接下来是英雄技能技能结构路径方便抓取 jQ的获取元素这里不细说重头戏抓包到到数据库全部代码看数据库总结打开官网看 ...
Python网络爬虫：爬取腾讯招聘网职位信息并做成简单可视化图表
hello,大家好,我是wangzirui32,今天我们来学习如何爬取腾讯招聘网职位信息,并做成简单可视化图表,开始学习吧! 文章目录 1. 网页分析 2. 获取json数据 3. 转换为Excel ...
Python爬虫之简单爬虫之爬取英雄联盟官网的英雄的皮肤
Python爬虫之简单爬虫之爬取英雄联盟官网的英雄的皮肤文章目录 Python爬虫之简单爬虫之爬取英雄联盟官网的英雄的皮肤背景:LOL这款游戏有着大量的玩家,这个游戏里面人们津津乐道的皮肤,每一款 ...
爬取中国最好大学网数据（Python的Scrapy框架与Xpath联合运用）
前言大二上学期学校外出实习,做了一个关于爬取中国最好大学网http://www.zuihaodaxue.com/rankings.html的项目用的这个Scrapy框架,多线程还挺好用 ...
Python爬虫实战 | (1) 爬取猫眼电影官网的TOP100电影榜单
在本篇博客中,我们将使用requests+正则表达式来爬取猫眼电影官网的TOP100电影榜单,获取每部电影的片名,主演,上映日期,评分和封面等内容. 打开猫眼Top100,分析URL的变化:发现Top ...
使用selenium + chrome爬取中国大学Mooc网的计算机学科的所有课程链接
目的:使用selenium + chrome爬取中国大学Mooc网计算机学科的所有的课程链接列表思路:找到每个分页的节点属性为class="m-course-list" 的div ...
爬虫实战6：爬取英雄联盟官网五个位置的综合排行榜保存到excel
申明:资料来源于网络及书本,通过理解.实践.整理成学习笔记. 文章目录英雄联盟官网获取一个位置的综合排行榜所有数据(上单为例) 获取所有位置的综合排行榜所有数据英雄联盟官网获取一个位置的综合排 ...
python利用mysql数据库实现一个中英文翻译程序兼单词试卷生成并改阅功能，并可以爬取有道官网进行在线翻译。
直接上运行截图(代码在后面) 开始界面使用navicat查看mysql数据库中的数据单词查询功能测试本地翻译一个本地数据库中有的单词本地翻译一个本地数据库中没有的单词爬取有道官网进行在线翻译 ...
python爬虫爬取王者荣耀官网全部英雄头像(源码分享)
这篇文章为源码分享,爬虫的分析过程请阅读文章 <用python爬取王者荣耀官网的英雄皮肤海报(含源码)> 源码 import requests import json from bs4 i ...

爬取中国所有银行官网网址信息

爬取中国所有银行官网网址信息相关推荐

最新文章

热门文章