• 目标站点

        巨潮资讯网

  • 目标

爬取银行的年报

  • 接口分析

上一篇博客里的api失效了,这里重新分析一下:


1.每只股票(公司、银行)对应的ordid、category、code 该网站贴心的整理为了json文件格式:

http://www.cninfo.com.cn/new/data/szse_stock.json

接口数据如下:

在这里面就可以方便查找需要的参数了,是不是很贴心。

直接存储为本地的json数据,需要时loads即可。


2.分析查询年报的接口

  • 请求地址为:
http://www.cninfo.com.cn/new/hisAnnouncement/query
  • 请求参数为:
{"pageNum": "1","pageSize": "30","column": "szse","tabName": "fulltext","plate": "","stock": "600036,gssh0600036","searchkey": "","secid": "","category": "category_ndbg_szsh","trade": "","seDate": "2016-12-01~2022-01-05","sortName": "","sortType": "","isHLtitle": "true"
}

seDate大家可以更具自己需要的年份设置

  • 响应为:

有的是摘要,大家根据自己需要过滤。

adjunctUrl即为PDF地址。

大家根据上述更新的API,自行更改代码,就能实现下载啦~有人需要代码,再写吧~

python爬取银行年报2相关推荐

  1. 【爬虫】用Python爬取公司年报1

    [目标]爬取公司年报 公司列表: bank_list = [ '中信银行', '兴业银行', '平安银行','民生银行', '华夏银行','交通银行', '中国银行', '招商银行', '浦发银行', ...

  2. python爬取公司年报

    1 环境准备 运行平台 本文是在linux系统上运行的,换成windows需要更换对应文件路径 python 包 logging (用于记录日志) 2 代码 简要叙述一下python代码,如下: &q ...

  3. Python爬取上交所年报并下载

    批量下载上交所年报及相关细节处理 一.使用工具 Python3.6.Pycharm 二.准备工作 import json import requests import re import dateti ...

  4. python爬取百部电影数据,我分析出了一个残酷的真相

    2019年就这么匆匆过去了,就在前几天国家电影局发布了2019年中国电影市场数据,数据显示去年总票房为642.66亿元,同比增长5.4%:国产电影总票房411.75亿元,同比增长8.65%,市场占比 ...

  5. 使用Python爬取CSDN历史博客文章列表,并生成目录

    使用Python爬取CSDN历史博客文章列表,并生成目录 这篇博客将介绍如何使用Python爬取CSDN历史博客文章列表,并生成目录. 2020年 2020年04月 cv2.threshold() 阈 ...

  6. Python爬取豌豆荚软件分类

    Python爬取豌豆荚软件分类以及下载量 一,查看网页 链接豌豆荚 红框内即为要爬取的元素 二,获取所有页签的地址: #爬取豌豆荚import requests from bs4 import Bea ...

  7. 用python爬取网贷之家p2p平台数据

    网贷之家中的p2p平台数据比较容易获取,重要的就是如何分析网页的源代码然后从里面提取自己需要的信息,也不需要用户登录,该网站的爬虫比较简单,主要用了urllib包来获取网页信息,用BeautifulS ...

  8. python爬取地图地址_Python爬取百度地图poi数据 !

    锵锵锵,我来啦.10天过的好快呀,4月份都已经过了三分之一,我的体重还居高不下,qwq.今天给大家分享python爬取百度地图小区的数据,希望大家看后,可以尝试自己编写爬取自己所在市的中学,公园,银行 ...

  9. python爬取电影评分_用Python爬取猫眼上的top100评分电影

    代码如下: # 注意encoding = 'utf-8'和ensure_ascii = False,不写的话不能输出汉字 import requests from requests.exception ...

最新文章

  1. 无线通信信号自由空间损耗
  2. 线程间到底共享了哪些进程资源
  3. 解决eclipse编译的几种方法
  4. python开源聊天机器人ChatterBot——聊天机器人搭建、流程分析、源码分析
  5. mongo数据库数据迁移到muysql数据库
  6. Single Area OSPF
  7. 数据库面试题【十八、优化关联查询优化子查询优化LIMIT分页优化UNION查询优化WHERE子句】
  8. TLS/SSl 相关攻击漏洞及检测方法(testssl.sh)
  9. aswing JTable用法
  10. linux安装python和pip3,Linux安装python3.6 和pip
  11. OpenCV学习(7.10)
  12. SqlServer 更新/新增一条语句,返回其中某一列的值 inserted,@@IDENTITY()
  13. apt-get install
  14. R语言读取Excel的神器——openxlsx
  15. 乐优商城项目实战视频教程
  16. Tbase基础积累一
  17. 电脑自带的edge浏览器无法访问解决问题
  18. yourenduwanglai的鬼话连篇(九)
  19. 【算法】五大常用算法最全面总结
  20. 心态-《不抱怨的世界》书中的精髓:通过4个步骤,成为一个不抱怨、每天都快乐的人。

热门文章

  1. [技术发展-25]:广播电视网、互联网、电信网、电网四网融合技术
  2. 【Cad To Word】高清晰度导入Word做法
  3. clock_gettime函数详解
  4. caj文件转换成word文档的软件
  5. SoundTouch变调编译以及算法代码详解
  6. 在word文档里使用LaTeX数学公式字体 mathcal mathbb mathbf
  7. docker容器网络的配置及常用操作
  8. 如何保证库存数量及时
  9. Learning to Identify Follow-Up Questionsin Conversational Question Answering
  10. CUDA11.1在线安装