原本链接:http://tecdat.cn/?p=4838

原文出处:拓端数据部落公众号

众所周知,在证券投资领域将涉及很多数据,因此,通过简单的处理难以有效地分析各种公司股票之间的关系,而关联规则挖掘可以很好的解决这个问题,它允许投资在大量数据中,发现企业股票的相关性,以进一步研究和分析。是股民的得力助手!

我们从2015年1月至2016年1月收集了香港部分上市公司的股票交易数据,作为分析主体,探讨其间的潜在影响。

现在通过关联规则分析挖掘出,当股价上涨的时候,另一股票的价格会随着情况而上涨的情况。

首先,股票交易数据可视化,观察股价之间的关系。 在IBM SPSS Modeler软件中,我们使用网络图节点来分析上市公司股价上涨的潜在联系,并找出其间的强关联规则。

线段的粗细程度由线段两端点的股票的价格同时上涨的天数决定,如果线段两端的股票的价格同时上涨的实际情况的频数越大,那么链接两只股票间的线段就越粗。如果线段两端的股票的价格同时上涨的实际情况的频数越小,那么链接两只股票间的线段就越细。从这一图中很明显的可以看出复兴医药和白云山之间有着很强的关联。

提高阈值的网络图

得到基于 Apriori 算法的关联规则的结果 :

关联规则结果

第一行规则表明, 当该白云山价格出现上涨的趋势时,股票复星医药的股价很可能也会随之上涨。原因是在股票的历史交易数据中发现股票白云山和股票复星医药 同时上涨的情况发生了 130 次,占总事件的 35%,在这些时候有 100%的时候股票白云山的价格也发生了上涨

但是预测对了就能挣钱吗? 这个就不一定。 建立的是一种数学或者统计模型,它能表现出已有数据的一些规律,但是未来的数据是否遵循这种规律,是不一定的。尤其是外在环境变量太多,甚至有人为因素。风险的控制,资金管理,自我情绪的管理这些都也很重要。技术大牛们都说系统交易到最后都是对人性的考验。

【大数据部落】IBM SPSS Modeler通过数据挖掘我们能从股市数据得到什么相关推荐

  1. IBM SPSS Modeler通过数据挖掘我们能从股市数据得到什么

    众所周知,在证券投资领域将涉及很多数据,因此,通过简单的处理难以有效地分析各种公司股票之间的关系,而关联规则挖掘可以很好的解决这个问题,它允许投资在大量数据中,发现企业股票的相关性,以进一步研究和分析 ...

  2. php 集成 spss,〖SPSS Modeler〗 IBM SPSS Modeler 整合不同数据库之间的数据

    来自IBM DEVELOPERWORKS 简介 由于目前企业客户的业务量和数据量都在不断的提高,随着企业的发展,很多企业的数据存储都不局限于同一个数据库上,如果要对这些存储在不同数据库上的数据进行处理 ...

  3. 使用IBM SPSS Modeler进行随机森林算法预测

    IBM SPSS产品系列最主要的两款软件为IBM SPSS Statistics和IBM SPSS Modeler. IBM SPSS Statistics主要用于统计分析,如均值比较.方差分析.相关 ...

  4. 《IBM SPSS Modeler数据与文本挖掘实战》之常用数据挖掘软件

    根据数据挖掘软件的开发目的和用途,一般可以分为专业型和通用型两种.专业型数据挖掘软件一般是针对某个特定领域的问题提供解决方案,在设计算法的时候充分考虑到数据的规模.类型以及研究者的需求等特点,并作了优 ...

  5. 《IBM SPSS Modeler数据与文本挖掘实战》之文本挖掘算法

    随着文档信息的迅猛发展,文本分类成为处理和组织大量文档数据的关键技术.现代文本分类和聚类领域面临巨大的挑战,而且随着学者研究的不断深入,其中的一些深层次问题也逐渐暴露出来,一些问题也已经成为本学科进一 ...

  6. IBM SPSS Modeler数据库内建模

    IBM SPSS Modeler Server支持对数据库供应商的数据挖掘工具和建模工具进行整合,其中包括IBM Netezza.IBM DB2 InfoSphere Warehouse.Oracle ...

  7. 非常值得收藏的 IBM SPSS Modeler 算法简介

    IBM SPSS Modeler以图形化的界面.简单的拖拽方式来快速构建数据挖掘分析模型著称,它提供了完整的统计挖掘功能,包括来自于统计学.机器学习.人工智能等方面的分析算法和数据模型,包括如关联.分 ...

  8. IBM SPSS Modeler 18.1最新版本正式发布 | 附下载

    IBM 数据挖掘分析平台IBM SPSS Modeler在市场上一直占据领导者地位,其专业性及易用性一直受到广大用户的喜爱,该平台也不负众望,我们的研发团队一直致力于不断的技术更新及功能的提升,最新版 ...

  9. IBM SPSS Modeler 【1】 K均值聚类

    一.聚类分析 在数据挖掘中,聚类分析关注的内容是一些相似的对象按照不同种类的度量构造成的群体.聚类分析的目标就是在相似的基础上对数据进行分类. IBM SPSS Modeler 提供了多种聚类分析模型 ...

  10. IBM SPSS Modeler随机森林算法介绍

    在之前的文章<Bagging 或Boosting让你的模型更加优化>中,我们介绍了可以通过Bagging或Boosting技术,使得模型更加稳定和准确率更高,那么今天要介绍的随机森林算法, ...

最新文章

  1. [转载]去除文件中的^M
  2. 关于STL 容器的嵌套使用, 小试牛刀
  3. code iban 是有什么组成_「面试」new String(abc)和abc有什么区别?反编译看看原理吧...
  4. poj3253 优先队列
  5. 第一行代码学习笔记第四章——探究碎片
  6. 优酷土豆2012.9.12校园招聘会笔试题
  7. confluent connect写出到ES及ClickHouse
  8. C/C++中static关键字的作用
  9. 服务器报告它来自digest_2020年全球服务器市场规模及竞争格局分析
  10. 铁路售票系统_黑龙江一学生购买的火车票上惊现“学猪”字样!铁路部门给出回应...
  11. python内存管理 变量_Python变量内存管理
  12. python3视频教学_Python3入门基础视频课程(下)
  13. 2020软考论文想要拿高分,要避开这些坑!
  14. 人口logistic模型公式_人口预测模型Matlab实现Logistic曲线模型
  15. Github Gitee Java开发 热门中后台开源项目
  16. android打开sd卡文件,从Android中的SD卡读取特定文件
  17. LeetCode 881. 救生艇
  18. Redis缓存一致性问题解决方案
  19. unity 全息和xRay shader
  20. 华为儿童手表可以升级鸿蒙吗,华为儿童手表 4X功能更新,儿童版微信上线

热门文章

  1. 图片滚动js 实现图片无缝滚动
  2. 学习英语,先记下留着后用
  3. 实训汇编语言设计——将bcd码转化为二进制数
  4. PHP下简单交换两个变量
  5. jdk StringBuilder实现
  6. netcore里使用jwt做登陆授权
  7. 第二季-专题13-NandFlash变硬盘
  8. 凸优化第五章对偶 5.5 最优性条件
  9. Go基础系列:Go实现工作池的两种方式(一)
  10. flask-mail扩展基本使用