如何批量下载上海证券交易所上市公司年报
一、简介
上海证券交易所上市公司定期报告下载,项目地址 https://github.com/thunderhit/shreport
github地址 https://github.com/thunderhit/shreport
pypi地址 https://pypi.org/project/shreport
二、安装
pip install shreport
三、功能说明
companys()上证所有上市公司名录,公司名及股票代码:return: 返回DataFrame
download(code, savepath)下载上市公司的所有季度报告、半年报、年报pdf文件:param code: 上市公司股票代码:param savepath: 存储的路径,建议使用相对路径:return:
pdfurls(code)获取年报文件下载链接:param code: 股票代码:return: 年报pdf链接
四、快速入门
一定要先获得cookies后才能使用下面的所有代码,这里先直接看代码使用情况,cookies获取可见文档 五、获取cookies
4.1 获取上证交易所上市公司目录
from shreport import SH
cookies = {"Cookie": '您的cookies'}
sh = SH(cookies)
df = sh.companys()
df.head(10)
Run
- -------- ------name code
0 浦发银行 600000
1 白云机场 600004
2 东风汽车 600006
3 中国国贸 600007
4 首创股份 600008
- -------- ------
代码中的sh.companys()获取的是DataFrame数据类型,所以大家还可以自己存储成excel
df.to_excel('上证交易所上市公司名录.xlsx')
4.2下载某公司所有定期报告文件
绝大多数报告文件名格式
代码
from pathlib import Path
from shreport import SH
cookies = {"Cookie": '您的cookies'}
sh = SH(cookies)
#获取当前代码所在的文件夹路径
cwd = Path().cwd()
#以浦发银行为例股票代码600000
sh.download(code='600000', savepath=cwd)
Run
=======请耐心等待,正在获取600000数据
=======准备获取600000年报文件链接========
=======年报文件链接已获取完毕=============
已成功下载600000_2000_1.pdf
已成功下载600000_2000_z.pdf
已成功下载600000_2000_3.pdf
已成功下载600000_2000_n.pdf
......
已成功下载600000_2019_1.pdf
已成功下载600000_2019_z.pdf
已成功下载600000_2019_3.pdf
已成功下载600000_2000_n.pdf
4.3 获取某公司的所有定期报告url
如果暂时不想下载定期报告pdf文件,可以只得到该公司所有的报告文件链接
from shreport import SH
cookies = {"Cookie": '您的cookies'}
sh = SH(cookies)
#以浦发银行为例股票代码600000
urls = sh.pdfurls(code='600000')
urls
Run
=======准备获取600000年报文件链接========
=======年报文件链接已获取完毕=============
['http://www.sse.com.cn/disclosure/listedinfo/announcement/c/600000_2000_1.pdf','http://www.sse.com.cn/disclosure/listedinfo/announcement/c/2002-10-30/600000_2002_3.pdf','http://www.sse.com.cn/disclosure/listedinfo/announcement/c/2002-08-17/600000_2002_z.pdf',.......'http://www.sse.com.cn/disclosure/listedinfo/announcement/c/600000_2002_1.pdf','http://www.sse.com.cn/disclosure/listedinfo/announcement/c/2019-03-26/600000_2018_n.pdf','http://www.sse.com.cn/disclosure/listedinfo/announcement/c/2018-10-31/600000_2018_3.pdf','http://www.sse.com.cn/disclosure/listedinfo/announcement/c/2018-08-30/600000_2018_z.pdf','http://www.sse.com.cn/disclosure/listedinfo/announcement/c/2018-04-28/600000_2017_n.pdf','http://www.sse.com.cn/disclosure/listedinfo/announcement/c/2018-04-28/600000_2018_1.pdf']
五、获取cookies
一定要先获得cookies后才能使用所有的代码,获取方法
浏览器访问http://www.sse.com.cn/disclosure/overview/
按F12(mac按option+command+I)打开开发者工具的Network
刷新网页,耐心寻找与www.sse.com.cn有关的任意网址,找到cookies
如果
如果您是经管人文社科专业背景,编程小白,面临海量文本数据采集和处理分析艰巨任务,个人建议学习 《python网络爬虫与文本数据分析》 视频课。作为文科生,一样也是从两眼一抹黑开始,这门课程是用五年时间凝缩出来的。自认为讲的很通俗易懂o( ̄︶ ̄)o,
python入门
网络爬虫
数据读取
文本分析入门
机器学习与文本分析
文本分析在经管研究中的应用
感兴趣的童鞋不妨 戳一下《python网络爬虫与文本数据分析》进来看看~
精彩回顾
Python网络爬虫与文本数据分析
如何使用Python快速构建领域内情感词典
Seaborn:一行代码生成酷炫狂拽的数据集可视化
50题matplotlib从入门到精通
30例 | 一文搞懂python日期时间处理
pdfkit | 自动化利器,生成PDF就靠它了
中文文本数据逻辑性分析库
中文文本分析相关资源汇总
cnsenti中文情绪情感分析库
Python全栈-60天精通之路
Python数据分析相关学习资源汇总帖
漂亮~pandas可以无缝衔接Bokeh
综述:文本分析在市场营销研究中的应用
2020年B站跨年晚会弹幕内容分析
YelpDaset: 酒店管理类数据集10+G
Loughran&McDonald金融文本情感分析库
万水千山总是情,给我点好看可好❤
如何批量下载上海证券交易所上市公司年报相关推荐
- python批量下载巨潮PDF年报
目录标题 背景 代码块 背景 (70条消息) 迅雷API批量下载巨潮年报_无敌的前任的博客-CSDN博客 代码块 from win32com.client import Dispatch #pip i ...
- Python批量下载上交所、深交所年报或半年报并生成年报下载器exe文件
效果预览 完整代码 import requests import csv import time import re import math import osSTART_DATE =input('公 ...
- 迅雷API批量下载巨潮年报
目录 说明 年报筛选流程 代码 说明 首先从巨潮页面用八爪鱼爬取公告链接列表,但是该链接指向页面还有一个下载按钮且链接无法在详情页对下载直接元素提取,索性链接之间有关系可以直接修改. 下载路径分开保存 ...
- 怎么将excel中的url批量转化为图片_Python+Wind 批量下载上市公司年报 - Part 1/2
Python+Wind 批量下载上市公司年报 - Part 1/2 作者:张捷 目录 1.背景介绍 2.安装Python 3.爬取万得上市公司年报 3.1Wind下载公告信息 3.2获得年报地址 4. ...
- python怎么批量下载年报_Python+Wind 批量下载上市公司年报 - Part 1/2
Python+Wind 批量下载上市公司年报 - Part 1/2作者:张捷 目录1.背景介绍 2.安装Python 3.爬取万得上市公司年报3.1Wind下载公告信息 3.2获得年报地址 4.使用P ...
- python 批量下载财务数据_Python+Wind 批量下载上市公司年报 - Part 1/2
Python+Wind 批量下载上市公司年报 - Part 1/2作者:张捷 目录1.背景介绍 2.安装Python 3.爬取万得上市公司年报3.1Wind下载公告信息 3.2获得年报地址 4.使用P ...
- python上市公司_Python批量下载上交所上市公司报告
上交所的上市公司报告搜索页面http://www.sse.com.cn/disclosure/listedinfo/announcement/ 通过查看页面调用的接口可以发现: 获取上交所全部股票代码 ...
- python批量下载上交所上市公司报告
上交所的上市公司报告搜索页面http://www.sse.com.cn/disclosure/listedinfo/announcement/ 通过查看页面调用的接口可以发现: 获取上交所全部股票代码 ...
- python怎么批量下载年报_使用Python批量下载Wind数据库中的PDF报告
原标题:使用Python批量下载Wind数据库中的PDF报告 背景 最近小编出于工作需要,准备在Wind金融数据终端批量下载上市公司2019年第一季度业绩预告.通过相关的条件检索,发现其相关数据有近百 ...
- python写的一个-批量下载股票年报的小工具
python写的一个-批量下载股票年报的小工具 from urllib import request import requests import os import openpyxl# print( ...
最新文章
- [JavaScript] JavaScript 数组挖掘,不只是讲数组哟
- (11)Xamarin.iOS - 新增iPhone storyboard
- 用泛型方法Java从实体中提取属性值,以及在泛型方法中的使用
- 80个招聘求职网站整理,不管招聘or求职,看这个就够了!
- mysql查找执行效率慢的SQL语句
- 干货下载 | 高效金融客户分析体系如何搭建?
- 腾讯面试后续 | 掘金技术征文
- 什么是 SAP vocabulary-based annotations
- SAP ABAP实用技巧介绍系列之反模式:一些低效的ABAP内表操作
- linux命令wget多个参数,wget 命令参数使用方法
- pygame.error: video system not initialized的解决办法
- paip.python错误解决8
- python画彩色城墙_只需 45 秒,Python 给故宫画一组手绘图!
- ps怎么加底部阴影_ps物体底部阴影怎么做阴影有立体感
- 感觉所有的方法都有人做了,NLPer怎么找创新点?
- Teamviewer 更改ID
- MongoDB分组查询数据库sql
- 小生意同样能赚大钱,卖豆芽都能一年存20多万?你怎么看?
- Word排版技巧分享
- 【TP5】安装Guzzle并简单使用
热门文章
- Terrasolid安装
- 计算机考研复试题(近十万字)
- [精易软件开发工程师Leo学习笔记]011DeBug(调试)
- 计算机机房辐射大吗6,我的办公室离机房只有一墙之隔,请问对孕妇辐射大吗?我们单位10多个电脑的交换机。...
- HTML颜色表及html代码(前端必备)
- 贝叶斯分析好坏_交易必读|浅谈贝叶斯分析
- 凯恩帝串口通信怎么设置_北京凯恩帝(KND)-100M数控系统操作经验与技巧
- 汉王速录笔linux驱动下载,汉王速录笔v600驱动 官方版
- 腾讯云短信设置流程图文介绍
- swagger注解介绍