思路

在网上可以看到很多关于股票的数据挖掘,其中也包括了一些大宗交易的数据挖掘和分析。本人之前也做过比较长时间的学习,所以出于好奇,尝试对这类数据进行挖掘:

  • 最开始的想法
    来看下百度百科对于大宗交易的解释:
    百度百科的大宗交易介绍

    总的来说,就是大宗交易在盘后完成,交易所公布交易双方的价格,数量和席位名称(如XX证券公司XX营业部)。
    有一个说法:股东要减持的话,往往是需要大量的时间和高超的操盘技巧的。如果存在一些第三方机构,可以直接把股票一次性接走,会省不少事。于是我们的目标就是尝试找到这些机构,或者找到符合某些规则的股票,就可以尝试去抱下大腿。

  • 实现的思路

    1. 从交易所或者第三方网站爬取大宗交易数据,通过交易软件获取股票的历史交易数据(日线);
    2. 数据存储和维度;
    3. 建模。
  • 工具
    python3.6, SQL SERVER2012, R3.4x

  • 流程图

大宗交易数据挖掘(一)相关推荐

  1. 大宗交易数据挖掘(二)

    获取数据 上一篇的流程图中介绍了大致思路,实际实现的时候,数据需要分成2个部分,历史数据和每日更新的数据.其中每日更新的数据量较小,直接从第三方数据网站获取,单线程爬虫即可搞定:历史数据用来做模型训练 ...

  2. 大宗交易数据挖掘(三)

    计算维度 数据集字段如下: 1. [CurClose],当前收盘价: 2. [TradePrice],大宗交易成交价: 3. [FluctRange3],近3日波动幅度(中途发现波动幅度太大,止损点不 ...

  3. 大宗交易数据挖掘(四)

    数据分析 维度初步整理好以后,可以尝试用R去做一些相关性分析,不过效果太差,因为实际情况中,线性回归的效果是很差的. 这里我定义了1个CHANCE的列(Factor),当买入天数(BuyRK)和卖出天 ...

  4. 如何学习数据挖掘和数据科学的7个步骤

    前言 概括 1 学习语言 2 工具:数据挖掘,数据科学和可视化软件 3 教科书 4 教育:网络研讨会,课程,证书和学位 5 数据 6 比赛 7 互动:会议,团体和社交网络 more 前言 最近一直一再 ...

  5. 数据挖掘的一些经典算法

    数据挖掘能做以下七种不同事情 (分析方法): 数据挖掘能做以下七种不同事情 · 分类 (Classification) · 估计(Estimation) · 预测(Prediction) · 相关性分 ...

  6. 关联规则挖掘算法_#数据挖掘初体验 使用weka做关联规则

    这学期选了数据挖掘课,前两节课刚好都没有去上课.照着教程练习一下课程内容... prepare 下载软件weka,根据系统选择版本,个人使用版本"a disk image for OS X ...

  7. python解释器环境中、用于表示上一次_大工20秋《数据挖掘》在线作业3 【标准答案】...

    可做奥鹏全部院校作业论文!答案请添加qq:599792222 或 微信:1095258436 大工20秋<数据挖掘>在线作业3 1.[单选题] 以下哪一种数据类型元素之间是无序的,相同元素 ...

  8. 数据挖掘公司D square nv 完成500万欧元B轮融资

    D square nv日前完成 500 万欧元 B 轮融资,融资方为 Gemma Frisius Fonds, Jürgen Ingels, Limburgse Reconversie Maatsch ...

  9. 案例:Oracle dul数据挖掘 磁盘损坏dul提取数据文件中表的数据及l

    通过使用Oracle DUL工具提取损坏磁盘里的数据库文件中的表及lob字段中内容 在有次8i的库恢复中,因为硬盘损坏导致几个表出现很多诡异性坏块,尝试使用dul对其进行挖掘数据,当时使用dul 9 ...

最新文章

  1. 在线实时大数据平台Storm集成redis开发(分布锁)
  2. Adapter适配器和base-adapter-helper库的使用
  3. LeetCode 1011. 在 D 天内送达包裹的能力(二分查找)
  4. MySQL————表维护相关低频操作总结
  5. linux上TCP connection timeout的原因查找
  6. Office与Visio同事安装兼容问题
  7. 如何在labview中用c语言编程,编程语言之争:LabVIEW还是C语言?-测试测量-与非网...
  8. Mcad学习笔记之异步编程(AsyncCallback委托,IAsyncResult接口,BeginInvoke方法,EndInvoke方法的使用小总结)...
  9. [Java] 蓝桥杯 BEGIN-1 入门训练 A+B问题
  10. matlab求任意点最短路径,【最短路】求两点间最短路径的改进的Dijkstra算法及其matlab实现...
  11. Hibernate配置文件,映射文件
  12. 我的WCF之旅(5):面向服务架构(SOA)和面向对象编程(OOP)的结合——如何实现Service Contract的重载(Overloading)...
  13. cvHoughLines2() 霍夫线变换
  14. 【老生谈算法】matlab实现LEACH 算法——LEACH 算法
  15. xcode run跑项目或者Archive打包项目的时候显示Build Succeeded一闪而过但是程序无反应问题解决
  16. 利用漏洞溢出掉360安全卫士逆向分析
  17. 操作系统(三)---Windows操作系统
  18. 百度地图让用户“私人定制“:一场语音定制背后的AI能力强势输出
  19. 图片怎么自定义裁剪?图片如何裁出想要的大小?
  20. nc网页版java插件下载_spring-nc

热门文章

  1. 图像区分平坦区域、边缘、角点区域
  2. 华为一碰传多屏协同超级终端最新教程(附带安装文件)
  3. 慕容话币:币圈投资缺点无处遁形,保持良好的心态有多难?
  4. 大话重构连载11:小步快跑是这样玩的
  5. wfGo 围棋 AI对弈模式
  6. Lesson 2 Thirteen equals one
  7. 黎曼的几何基础,维度
  8. vue中如何使用SM4国密来加密?
  9. 安全测试-SQL注入
  10. gensim 主题模型 seed