这个模块可以帮助我们了解到当前哪些板块是资金所青睐的,虽说有时候板块轮动的很快,但不妨碍呀,我们可以在板块刚启动的阶段就快速知道,毕竟在钱多的地方才更容易赚钱。

目标网站

aHR0cHMlM0EvL2RhdGEuZWFzdG1vbmV5LmNvbS9ia3pqL2h5Lmh0bWw=

目录

  1. 分析请求
  2. 代码实现

1、分析请求

目标数据主力净流入金额,如图1-1。

图1-1

在查找请求的时候我发现有两个数据接口,接口A只有行业以及资金流入的情况(这个接口可以直接一次性获取完全部数据),接口B还包括了该板块今日流入最大的个股(但是不能一次性获取完数据需要换页才可以获取全部数据,这里涉及到了Ajax的问题,有不懂Ajax的小伙伴可以看看——Ajax数据获取),这里选择从接口B获取数据,这样不单可以知道哪个行业最火还可以知道该行业中哪个个股的是最受资金青睐的。

图1-2 接口A
图1-3 接口B

2、代码实现

这网站没有加密参数,做好headers就好了,需要注意的是这个网站返回的数据并不是json格式而是看起来像json的文本格式(如图2-1),我们需要将这文本格式转为json格式。

图2-1

两种方法:

1、正则(这里我就不过多介绍了不懂的可以查看——),

2、eval方法

eval可以用来执行一个字符串表达式,如下代码:

a = '[1, 2, 3]
print(type(a), a)     # <class 'str'> [1, 2, 3]
print(type(eval(a)), eval(a))  # <class 'list'> [1, 2, 3]

我们可以将返回的数据切割成标准的json格式,再使用eval转为json,实现代码如下:

def jquery_list(jquery, data_mode='['):reverse_mode = {'[': ']', '{': '}', '(': ')'}tail_str = jquery[-5:][::-1]return eval(jquery[jquery.index(data_mode): -tail_str.index(reverse_mode[data_mode])])

请求代码很简单相信认真看了我文章的小伙伴都可以轻松解决吧。

Python爬虫 | 获取股票行业资金流向相关推荐

  1. Python 爬虫 | 获取股票基本面数据

    今天给大家分享一个关于基本面的公式,提前申明一下这个公式不是我想出来的,不做投资依据.这个公式出自<股市稳赚>作者是(美)乔尔·格林布拉特,我在百度上粘贴一段他的介绍下来:"乔尔 ...

  2. Python爬虫获取基金持仓股票数据

    Python爬虫小实战 . 通过Python爬虫获取基金持仓股票数据,按照基金持仓金额对股票进行排行,并储存在本地数据库. from urllib import request from bs4 im ...

  3. 使用Python爬虫获取上交所和深交所所有股票的名称和交易信息

    使用Python爬虫获取上交所和深交所所有股票的名称和交易信息 功能描述 目标 获取上交所和深交所所有股票的名称和交易信息 输出 保存到文件中 技术路线 requests-bs4-re 候选数据网站的 ...

  4. 编写python爬虫 获取中华英才网全网工资数据

    做数据分析 数据挖掘,第一步是获取数据,在这里,我们要分析现今全国各地各个职业的工资情况. 我们选择较为权威的'中华英才网',编写python爬虫获取该网站上的各个招聘信息说给出的工资,再取其行业工资 ...

  5. python爬虫获取基金数据2

    用sklearn分析基金数据<1> python爬虫获取基金数据<2> 数据预处理:数据清洗.生成样本数据<3> 用sklearn训练样本数据<4> 用 ...

  6. python爬虫之股票数据定向爬取

    python爬虫之股票数据定向爬取 功能描述 目标:获取上交所和深交所所有股票的名称和交易的信息 输出:保存到文件中 技术路线:requests-bs4-re 前期分析 选取原则:股票的信息静态存在H ...

  7. Python免费获取股票业绩预告【附源码】

    在众多的股票量化策略里,我比较钟爱一个策略:净利润断层 直观理解就是在股票的业绩预告.业绩快报.业绩报告等报告出来的时候,因为业绩超预期,股价会有一个跳空高开形成缺口,而且因为上攻力量比较强,这个缺口 ...

  8. Python爬虫获取文章的标题及你的博客的阅读量,评论量。所有数据写入本地记事本。最后输出你的总阅读量!

    Python爬虫获取文章的标题及你的博客的阅读量,评论量.所有数据写入本地记事本.最后输出你的总阅读量!还可以进行筛选输出!比如阅读量大于1000,之类的! 完整代码在最后.依据阅读数量进行降序输出! ...

  9. python Chrome + selenium自动化测试与python爬虫获取网页数据

    一.使用Python+selenium+Chrome 报错: selenium.common.exceptions.SessionNotCreatedException: Message: sessi ...

最新文章

  1. mysql skip network_MYSQL-skip-networking
  2. 人工智能产业的发展是什么样的呢?
  3. MOCTF-Web-PHP黑魔法
  4. EntityFramework进阶——数据变更冲突
  5. kubernetes Pod yaml解析注释
  6. AHP计算权重.mat
  7. 【排队模型】基于粒子群优化核酸检测排队问题附matlab代码
  8. 一款PC版罗盘圆形时钟桌面屏保V1.0
  9. 抓取taobao的IP库
  10. NMAD-2.14b1安装
  11. 索引数组与关联数组的定义及区别
  12. 金色css颜色代码大全,CSS颜色代码大全
  13. CSAPP - LAB 1 datalab
  14. php反向解析ip,什么是反向IP查找
  15. Commons-Collections简介
  16. 阿里面试确实严格,面了整整5轮,还好我技高一筹!
  17. 你知道linux的复制命令吗?cp
  18. node项目实战-用node-koa2-mysql-bootstrap搭建一个前端论坛
  19. Android 仿豌豆荚应用列表进入详情效果
  20. 微软IE不再“孤单” 首选12种浏览器曝光(每日关注2009.12.18)

热门文章

  1. springboot身体健康诊疗系统毕业设计源码181049
  2. cent os 火狐_本周关注我们:整体框架和Firefox OS
  3. 磷酸铁锂离子蓄电池的特点
  4. 高精度GNSS定位的校正服务——状态域(SSR)校正和观测域(OSR)校正
  5. 计算机二战一个双非学校怎样,双非二战学长成功调剂985:看他的调剂院校选择!...
  6. 冯唐和蔡康永给新养医美做广告
  7. NOIP2018·赛道修建
  8. 未来可能发生的十大颠覆性科技创新
  9. Linux系统aboutyou,Linux字符设备驱动高级
  10. fortran中如何提供计算程序运行时间?