打开北京证券交易所官网,点击发行上市,然后点击公开发行信息披露,然后在查询框里面输入关键词:在北京证券交易所上市招股说明书,然后选择时间,点击查询,就可以看到所有北交所上市公司的招股说明书了,一共4页

查看网页源代码,在network里面,可以看到动态网页的真实地址,然后点击payload,矿业看到动态网页的参数:

然后可以在ChatGPT中输入提示词如下:

你是一个Python编程专家,任务是爬取网站数据,具体步骤如下:

打开网站:

https://www.bse.cn/disclosureInfoController/zoneInfoResult.do?callback=jQuery331_1688797937558?disclosureType=&disclosureTypes%5B%5D=9533&page={0}&companyCd=&fileName=&inquiryList=&startTime=2022-01-01&endTime=2023-07-08&keyword=%E5%8C%97%E4%BA%AC%E8%AF%81%E5%88%B8%E4%BA%A4%E6%98%93%E6%89%80%E4%B8%8A%E5%B8%82%E6%8B%9B%E8%82%A1%E8%AF%B4%E6%98%8E%E4%B9%A6&isLink=1&needFields%5B%5D=companyCd&needFields%5B%5D=xxfcbj&needFields%5B%5D=companyName&needFields%5B%5D=disclosureTitle&needFields%5B%5D=disclosureCode&needFields%5B%5D=disclosurePostTitle&needFields%5B%5D=destFilePath&needFields%5B%5D=publishDate&needFields%5B%5D=fileExt&sortfield=xxssdq&sorttype=asc

其中,Page参数的值是从0到3

获取每页返回的jsonp格式的内容,并打印输出;

去掉jsonp格式内容开头的“jQuery331_1688797937558”字符,

解析嵌套其中的"listInfo"json数据,然后解析嵌套"listInfo"中的"content"json数据;

然后提取"content"中"companyCd"、"companyName"、"destFilePath"、"disclosureTitle"、"publishDate"这些字段内容到F盘“北交所招股说明书.xlsx”;提取到字段内容后要打印输出;

注意:每一步都要输出信息;每页数据爬取后暂停5秒;

程序运行后,数据爬取正常,但是保存到excel表格时出错:

让ChatGPT修复,然后再次运行,成功获取所有上市公司的招股说明书PDF文件下载地址:

接下来,在ChatGPT中输入提示词:

写一段Python程序,来批量下载PDF文件:

F盘有一个文件:北交所招股说明书.xlsx,

读取表格里面的companyName,然后加上“招股说明书”,作为PDF文件名称;

读取表格里面的destFilePath,前面加上“https://www.bse.cn”,作为PDF文件下载的URL地址;

下载所有PDF文件,保存到F盘的文件夹:“北交所招股说明书”

注意:每一步都输出信息;每下载一个PDF文件,暂停5秒;

ChatGPT炒股:批量下载北交所上市公司的招股说明书相关推荐

  1. Python自动化小技巧13——批量下载北交所上市公司年报

    案例背景 同学问能不能爬虫下载年报,要下很多公司,一个一个搜索下载太慢了... 这种重复性的劳动交给Python脚本可太适合了 核心思想还是使用selenium库去模拟人输入股票代码和搜索下载. 北交 ...

  2. python上市公司_Python批量下载上交所上市公司报告

    上交所的上市公司报告搜索页面http://www.sse.com.cn/disclosure/listedinfo/announcement/ 通过查看页面调用的接口可以发现: 获取上交所全部股票代码 ...

  3. python批量下载上交所上市公司报告

    上交所的上市公司报告搜索页面http://www.sse.com.cn/disclosure/listedinfo/announcement/ 通过查看页面调用的接口可以发现: 获取上交所全部股票代码 ...

  4. python批量下载深交所上市公司定期报告

    python代码 import os import math import json import requests from copy import deepcopyURL = 'http://ww ...

  5. ChatGPT炒股:从上市公司招股说明书中批量提取发明专利表格

    上市公司招股说明书通常会详细列明公司的发明专利,而通过企业的发明专利可以了解企业未来的业务布局情况,怎么把这些发明专利列表都批量提取出来呢? 随机打开几个上市公司的招股说明书,可以看到发明专利这一内容 ...

  6. ChatGPT炒股:自动批量下载萝卜投研网站上的股票研报

    萝卜投研网站有很多的股票研究报告. 如果我们在chrome浏览器中打开了很多研报,该如何批量下载呢? 查看网页源代码,研报是pdf格式,下载链接也在源代码中,很好找. 下载方法是,用Selenium来 ...

  7. ChatGPT炒股:自动批量下载choice每日热门研报

    东方财富choice里面研究报告板块,每天更新研报几百篇,24小时热门研报也接近100篇.作为股票投资者,每天阅读最新热门研报,了解市场动态,是一个基本功.怎么可以自动批量下载这些24小时热门研报呢? ...

  8. 怎么将excel中的url批量转化为图片_Python+Wind 批量下载上市公司年报 - Part 1/2

    Python+Wind 批量下载上市公司年报 - Part 1/2 作者:张捷 目录 1.背景介绍 2.安装Python 3.爬取万得上市公司年报 3.1Wind下载公告信息 3.2获得年报地址 4. ...

  9. python怎么批量下载年报_Python+Wind 批量下载上市公司年报 - Part 1/2

    Python+Wind 批量下载上市公司年报 - Part 1/2作者:张捷 目录1.背景介绍 2.安装Python 3.爬取万得上市公司年报3.1Wind下载公告信息 3.2获得年报地址 4.使用P ...

最新文章

  1. Yahoo!网站性能最佳体验的34条黄金守则
  2. python操作mysql的增删改查_详解使用pymysql在python中对mysql的增删改查操作(综合)...
  3. 比较器Comparable(内部比较器)和Comparator(外部比较器)
  4. linux系列之:告诉他,他根本不懂kill
  5. 文件系统应用笔记之一:FatFS在STM32F4上的移植
  6. 甲骨文Java 14来啦!
  7. mysql索引方式_MySQL数据库的索引方式
  8. 在线预览word,excel,ppt
  9. 为什么像王者荣耀这样的游戏Server不愿意使用微服务?
  10. NLP数据预处理——同义词替换程序
  11. 山东大学暑期实训——智能人物画像综合分析系统
  12. 福利!H3CNE认证网络工程师GB0-191 考试试题库超详细解析-02。持续更新~~
  13. 【华为机试】鸡蛋放在篮子里
  14. C语言入门(一代小白被迫被拔苗助长)
  15. 知数堂全网通缉这个人
  16. ajax鼠标悬停,mouseout后触发jQuery Ajax鼠标悬停事件
  17. URL欺骗的惯用招式(经典网络知识)
  18. 流动性持续改善,佳源国际迎来“戴维斯双击”?
  19. linux下的EC20的监控python脚本
  20. shell入门基础知识

热门文章

  1. iOS 组件化的创建 -创建 cocoapods 库
  2. 一些熟悉而又值得较真的函数
  3. sessionId在每次request请求时变化的问题处理
  4. 文思海辉大厦介绍-摘自网络
  5. linux 轻系统下载,7款值得尝试的轻量级Linux操作系统。
  6. 【案例讲解】LVGL GIF开机动画和关机动画
  7. Docker 环境准备好这些,工作就完成了一半
  8. 2023 年互联网就业怎样?
  9. PCIe MSIx ITS
  10. php的setinc方法,ThinkPHP 统计数据(数字字段)更新 setInc 与 setDec 方法