爬取搜狐股票

  • 完整程序

完整程序

利用搜狐新闻的股票列表,构造url爬取信息

import requests
from bs4 import BeautifulSoup
import json
import csvdef getnum():html = requests.get("https://q.stock.sohu.com/cn/bk_3137.shtml")#获取想要的股票号码html.raise_for_statustext = html.textsoup = BeautifulSoup(text,'html.parser')tdL1 = soup.find_all('td',attrs={"class": "e1"})tdL2 = soup.find_all('td',attrs={"class": "e2"})numL =[]for td1,td2 in zip(tdL1,tdL2):try:numL.append([td1.text,td2.text])except:continuereturn numL#返回所有股票号码def getgupiao(numL):for num in numL:try:url = 'https://q.stock.sohu.com/hisHq?code=cn_'+num[0]+'&stat=1&order=D&period=d&callback=historySearchHandler&rt=jsonp&0.13888967033291877'r = requests.get(url)r.raise_for_status()r.encoding = "gbk"html = r.text[21:-2]#去BOM头data = json.loads(html)datalist = data[0]['hq']with open(num[1]+'.csv', "w",newline='') as csvFile:#写入股票信息csvWriter = csv.writer(csvFile)csvWriter.writerow(['日期','开盘','收盘','涨跌额','涨跌幅  ','最低','最高','成交量(手)','成交金额(万)','换手率'])for data in datalist:csvWriter.writerow(data)csvFile.closeprint(num[1],'爬取成功')except:continuedef main():numL = getnum()getgupiao(numL)print("爬取完成!")main()

#python爬虫#爬取搜狐股票相关推荐

  1. python爬虫股票上证指数_Python爬虫爬取搜狐证券股票数据

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. 以下文章来源于IT信息教室,作者:M先森看世界 数据的爬取 我们以上证50的股票为例,首先需 ...

  2. python爬虫爬取东方财富网股票走势+一些信息

    一.目标 我们的目标是爬取东方财富网(https://www.eastmoney.com/)的股票信息 我的目标是爬取100张股票信息图片 经过实际测试我的爬取范围为000001-000110,000 ...

  3. python爬虫搜狐新闻_应用案例2:爬取搜狐体育的新闻信息

    爬虫学习使用指南 Auth: 王海飞 Data:2018-06-25 Email:779598160@qq.com github:https://github.com/coco369/knowledg ...

  4. Python爬虫——主题爬取搜狐新闻(步骤及代码实现)

    目录 一 .实现思路 二.获取url变化规律 三.爬取新闻名称及其超链接 四.判断与主题的契合度 四.输出结果 五.总代码 一 .实现思路 本次爬取搜狐新闻时政类 获取url--爬取新闻名称及其超链接 ...

  5. Python爬虫 爬取新浪微博热搜

    Python爬虫 爬取新浪微博热搜 文章目录 Python爬虫 爬取新浪微博热搜 网页分析 数据爬取 数据存储 全部代码 网页分析 找到热搜的排名,标题和热度,发现它们在同一路径 数据爬取 impor ...

  6. python爬取搜狐新闻网站所有新闻的标题和正文并按阅读量排行输出

    # _*_ coding: utf-8 _*_ """实现定量爬取搜狐网站新闻 Author: HIKARI Version: V 0.2 ""&qu ...

  7. Python爬虫——爬取股票信息

    Python爬虫--爬取股票信息 1. 准备工作 每一次浏览器访问网页,会自动向浏览器服务器发送本地的电脑信息(headers),远方服务器接收到信息后会反馈给你网页信息(response),然后电脑 ...

  8. python爬虫爬取知网

    python爬虫爬取知网 话不多说,直接上代码! import requests import re import time import xlrd from xlrd import open_wor ...

  9. python爬虫,爬取下载图片

    python爬虫,爬取下载图片 分别引入以下三个包 from urllib.request import urlopen from bs4 import BeautifulSoup import re ...

最新文章

  1. 直接上手!不容错过的Visual Studio Code十大扩展组件
  2. 远程桌面,设置为支持2个人连接
  3. MySQL复制类型介绍
  4. Linux的企业-Mfs高可用corosync+pacemaker+fence+iscci
  5. 【转】犹太人的10句话,每一句都值得深思
  6. SQL查询语句执行速度快,存储过程执行慢
  7. 其他-私人♂收藏(比赛记录 Mar, 2019)
  8. xgboost实例_XGBoost超详细推导,终于有人讲明白了!
  9. perror()与strerror()的应用及区别 man手册查询
  10. 如何实现快速高效开发?低代码平台jeecgboot完美解决—jeecgboot3.1新特性
  11. Java 使用SAX解析XML文档
  12. oracle共享内存段手工清理
  13. JAVA--异常(1)
  14. 逻辑回归(Logistic Regression)学习笔记
  15. 硅谷初创企业控制成本 裁员风渐起
  16. 将数字金额转换成大写金额
  17. matlab 读取.pgm,【数字图像处理】pbm/pgm/ppm图片的读写(Matlab)
  18. 【寻找最佳小程序】12期:小程序数据助手——微信官方打造,移动端数据分析工具...
  19. 白帽子讲Web安全(第 1 章 我的安全世界观)
  20. 中国十六烷基磷酸钾行业市场供需与战略研究报告

热门文章

  1. 中创公益|中创算力荣获“2022年度突出贡献爱心企业”
  2. Lua脚本简明入门(整理自脚本之家)
  3. Windows操作系统上sqlloader的使用
  4. 智合同丨如何建立完整、高效的合同范本管理体系
  5. 手机如何一键修改运营商的名称跟标识的快捷方法
  6. 【Python】文本文件生成词云图片-单字过滤和任意形状词云和清晰度提高
  7. IOS游戏名字的本地化修改
  8. 【搞笑】如何逼死维护人员
  9. dobbo 什么时候流行_六一节来了!情歌一晃就老了争什么争离别的眼泪红尘情歌无缘的情人首首好听...
  10. php 留两个小数点,php 保留小数点