举例
目标网站 : 东方财富网 (排行)  沪深A股
网站是使用Ajax异步加载
url: http://quote.eastmoney.com/center/gridlist.html#hs_a_board


因为是Ajax异步加载 所以要找到包含数据的json接口

包含数据json   url : http://33.push2.eastmoney.com/api/qt/clist/getparams = {'cb': 'jQuery1124011214511892561374_1575904469870','pn': 1,'pz': '20','po': '1','np': '1','ut': 'bd1d9ddb04089700cf9c27f6f7426281','fltt': '2','invt': '2','fid': 'f3','fs': 'm:0 t:6,m:0 t:13,m:0 t:80,m:1 t:2,m:1 t:23','fields': 'f1,f2,f3,f4,f5,f6,f7,f8,f9,f10,f12,f13,f14,f15,f16,f17,f18,f20,f21,f23,f24,f25,f22,f11,f62,f128,f136,f115,f152','_': '1575904469955'
}参数规律  pn值 +1 得到数据json而且掌握网页规律后,使用循环就可以得到所有数据的json,然后进行清洗,就变成我们想要的数据了

具体的代码如下 (包括数据清洗,和存储mysql数据库)

# _*_ coding: utf-8 _*_
# Date: 2019/12/10 0010 12:51
# Author: Mijiu
# Version: 1.0
import json
import time
import pymysql
import requests# 东方财富网
def getPage( number):'''对目标网站进行数据采集:param number: 采集多少页:return: 采集到的数据'''strUrl = 'http://33.push2.eastmoney.com/api/qt/clist/get'params = {'cb': 'jQuery1124011214511892561374_1575904469870','pn': str(number),'pz': '20','po': '1','np': '1','ut': 'bd1d9ddb04089700cf9c27f6f7426281','fltt': '2','invt': '2','fid': 'f3','fs': 'm:0 t:6,m:0 t:13,m:0 t:80,m:1 t:2,m:1 t:23','fields': 'f1,f2,f3,f4,f5,f6,f7,f8,f9,f10,f12,f13,f14,f15,f16,f17,f18,f20,f21,f23,f24,f25,f22,f11,f62,f128,f136,f115,f152','_': '1575904469955'}response = requests.get(strUrl, params=params)# 处理多余数据方便转换为字典data = response.text.replace("jQuery1124011214511892561374_1575904469870",'').replace('(',"").replace(')','').replace(';','')return json.loads(data)num_a = 0def Get_Data(num):'''对东方财富网抓抓取的数据进行处理:return:'''global num_afor i in range(1, num):time.sleep(0.2)data = getPage(i)for t1 in data.get('data').get('diff'):num_a+=1sql = 'insert into STOCK values(%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s);'list1 = [str(num_a),t1.get('f12'),t1.get('f14'),t1.get('f2'),t1.get('f4'),t1.get('f5'),t1.get('f6'),t1.get('f7'),t1.get('f8'),t1.get('f15'),t1.get('f16'),t1.get('f17'),t1.get('f18'),t1.get('f23')]Get_mysql(sql_ = sql,data = list1)
# f2最新价 f3涨跌幅 f4涨跌额 f5成交量 f6成交额 f7振幅  f8换手率 f12 代码  f14 名称  f15最高价  f16最低  f17今开 f18昨收  f23 市净率def Get_mysql(sql_,data):conn = pymysql.connect(host="127.0.0.1",user="root",port=3306,passwd="mysql123",db="stock",charset="utf8")cursor = conn.cursor()cursor.execute(sql_,data)conn.commit()cursor.close()conn.close()print("数据存储成功!")if __name__ == '__main__':Get_Data(100)   # 传入100代表采集100页数据

数据如下

抓取东方财富网股票信息相关推荐

  1. python中plguba_Python量化交易进阶讲堂-爬虫抓取东方财富网股吧帖子

    欢迎大家订阅<Python实战-构建基于股票的量化交易系统>小册子,小册子会陆续推出与小册内容相关的专栏文章,对涉及到的知识点进行更全面的扩展介绍.本篇专栏为小册子内容的加推篇!!! 前言 ...

  2. Python爬虫抓取东方财富网股票数据并实现MySQL数据库存储(转)

    Python爬虫可以说是好玩又好用了.现想利用Python爬取网页股票数据保存到本地csv数据文件中,同时想把股票数据保存到MySQL数据库中.需求有了,剩下的就是实现了. 在开始之前,保证已经安装好 ...

  3. python抓取数据库数据_Python爬虫抓取东方财富网股票数据并实现MySQL数据库存储...

    Python爬虫可以说是好玩又好用了.现想利用Python爬取网页股票数据保存到本地csv数据文件中,同时想把股票数据保存到MySQL数据库中.需求有了,剩下的就是实现了. 在开始之前,保证已经安装好 ...

  4. python爬虫实现股票数据存储_Python爬虫抓取东方财富网股票数据并实现MySQL数据库存储!...

    Python爬虫可以说是好玩又好用了.现想利用Python爬取网页股票数据保存到本地csv数据文件中,同时想把股票数据保存到MySQL数据库中.需求有了,剩下的就是实现了. 在开始之前,保证已经安装好 ...

  5. python爬虫爬取股票软件数据_Python爬虫抓取东方财富网股票数据并实现MySQL数据库存储(转载)...

    完整代码 实际上,整个事情完成了两个相对独立的过程:1.爬虫获取网页股票数据并保存到本地文件:2.将本地文件数据储存到MySQL数据库.并没有直接的考虑把从网页上抓取到的数据实时(或者通过一个临时文件 ...

  6. MySQL 怎么插入10天前的日期_Python爬虫抓取东方财富网股票数据并实现MySQL数据库存储!...

    Python爬虫可以说是好玩又好用了.现想利用Python爬取网页股票数据保存到本地csv数据文件中,同时想把股票数据保存到MySQL数据库中.需求有了,剩下的就是实现了. 在开始之前,保证已经安装好 ...

  7. Python爬虫抓取东方财富网股票数据并实现MySQL数据库存储

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取 python免费学习资 ...

  8. 爬取东方财富网的部分股票信息(1)

    爬取东方财富网的部分股票信息(1) 目标:爬取东方财富网的部分股票的名称.代码.涨跌幅.融资余额.融资融券余额.股东户数 编程语言:Python 3.7 开发IDE:Visual Studio 201 ...

  9. Python爬虫爬取东方财富网的股票信息

    简单的Python爬虫应用 目标:爬取东方财富网的股票信息 1.先找到要爬取的网页 2.第二步开始爬取信息 2.1 通过requests获取网页信息 2.2再通过BeautifulSoup解析: 2. ...

最新文章

  1. nf_hook_slow函数
  2. 品尝阿里云容器服务:5个2核4G节点使用情况记载
  3. mysql or 创建索引_Mysql索引优化
  4. 【源码】2012年斗地主结构算法公布(斗地主结构算法)
  5. VirtualBox桥接网络的简单配置,让虚拟机直接访问网络
  6. ubuntu使用git时,终端不显示git分支。
  7. OAuth2.0 使用 JWT令牌
  8. iOS 自动化发布 Fastlane 本地构建 IPA 并分发
  9. word2vec的应用场景
  10. 2020 比特大陆 面经
  11. 操作系统引导-----QEMU环境下制作boot引导程序
  12. html加减乘除除数不能为零,如何用正则表达式表示除数不为0 呢
  13. MacOS 利用keka.app压缩工具制作dmg文件
  14. VUE根据url下载文件
  15. 什么是云数据库?这篇文章详细告诉你!
  16. 扩展ACL ---王贝的学习笔记
  17. 自动打call机 qq伪自动发消息
  18. 计算机主板华擎,华擎主板怎么样靠谱吗
  19. 朋友圈都在说的央行数字货币,究竟跟你有什么关系
  20. Tomecat端口8005被占用解决方法

热门文章

  1. cesium面积计算_GitHub - BulletYuan/bulletCesium: GIS可视化——基于Cesiumjs的一些工具类,测量距离、测量面积。持续更新......
  2. Vue Router 实现路由控制实战
  3. 合数python_python输出100以内的质数与合数
  4. Win7怎么卸载微软输入法?
  5. vulnhub Earth:解题思路
  6. 选生物化学历史能不能报计算机专业,选历史同样可以当医生,想要学医的看过来,这是一份全面指导...
  7. Win10提示缺少mscomctl.ocx文件
  8. win2008服务器蓝屏如何修复,win2008r2 老是蓝屏重启。
  9. Python — 词汇表(一)
  10. 攻防世界MISC(杂项)新手练习区