SVM 支持向量机

原理就不赘述了,其余的文章有讲过。SVM是一种十分优秀的分类算法,使用SVM也能给股票进行一定程度上的预测。

核心

因为是分类算法,因此不像ARIMA一样预测的是时序。分类就要有东西可分,因此将当日涨记为1,跌记为0,作为分类的依据。使用历史数据作为训练数据。

处理数据:

1.股票历史数据来源于yahoo_finance api,获取其中Open,Close,Low,High,Volume作为基础。因为除去Volume以外,其余数据都是Price,基于Price并不能很好的表达股票的特性,或者说并不太适用于SVM分类算法的特性。基于SVM算法的特性,股票并不是到达一个价格范围就有大概率涨或跌(不知道我这个表达大家能不能看懂)。

2.基于上述原因,我决定将Price转换成另一种形式的数据。例如:High-Low=全天最大价格差,Open-YesterdayOpen=当天Open价格变动,Open-YesterdayClose=开盘价格变动。(我也并不太懂经济学,仅仅是为了寻找另一种更好的方案)

3.单纯地基于历史数据是完全不够的,因此还使用了R语言和tm.plugin.sentiment包,进行语义分析,进行新闻正面负面的判定。这块不是我做的,了解的并不多。新闻并不是每天都有的,这样的话新闻数据就显得有些鸡肋,无法在分类算法中起到作用,但是我们能在多个站点中提取,或是直接将关键字定为Debt(判断大众反应)。

4.这里仅仅是进行了两个站点的新闻挖掘,然后可通过rpy2包在Python中运行R语言,或是R语言得到的数据导出成Json,Python再读取。至此,数据处理告一段落。

SVM算法:

股票数据不能完全基于历史数据,因此需要一定数量的历史数据推出预测数据,例如这边使用了70天的数据训练,来推出后一天的股票涨跌,而不是所有的历史数据。

最后的成绩是53.74%的正确率,对于一个基本使用历史数据来预测股市的方法而言已经是个不错的结局了。

Github

https://github.com/jerry81333/StockProdiction/

python基于svm实现指数预测_基于SVM的股票预测 Python实现 附Github相关推荐

  1. 基于ai的预测_基于AI的预测性维护可增强战备状态,减少飞行故障

    基于ai的预测 By Philong Duong, Senior Product Manager 高级产品经理Philong Duong As a leading provider of AI-ena ...

  2. bagging和时间序列预测_时间序列的LSTM模型预测——基于Keras

    一.问题背景     现实生活中,在一系列时间点上观测数据是司空见惯的活动,在农业.商业.气象军事和医疗等研究领域都包含大量的时间序列数据.时间序列的预测指的是基于序列的历史数据,以及可能对结果产生影 ...

  3. python实现空气质量提醒程序_基于Python实现空气质量指数可视化

    前面我们已经爬取了全国城市空气质量数据( 基于Python实现城市空气质量爬取 ),基于之前我们爬取的数据,本文将使用Python将空气质量最好的前20个城市以柱状图的形式展示出来,点击对应的柱状图能 ...

  4. 基于python的气象数据分析统计服_基于Python的风向风速数据分析的设计与实现

    基于 Python 的风向风速数据分析的设计与实现 李文倩 ; 刘婕 [期刊名称] < <信息通信> > [年 ( 卷 ), 期] 2019(000)009 [摘要] Pyth ...

  5. svm 图片加标签_基于半监督的SVM多标签图数据分类算法研究

    宋文广 李程文 谭建平 摘   要:传统的图数据分类研究主要集中在单标签集,然而在很多应用中,每个图数据都会同时具有多个标签集.文章研究关于多标签图数据分类问题,并提出基于半监督的SVM多标签图数据分 ...

  6. python制作浏览器 脚本之家_基于Python打造账号共享浏览器功能

    本篇文章介绍的内容会涉及到以下知识: PyQt5的使用; Selenium的使用; 代理服务器的架设和使用: 一.账号限制之痛 在如今的互联网中,免费的信息和资源占据了很大一部分,各类互联网应用提供了 ...

  7. 基于python的电商网站建设_基于Django的电子商务网站开发

    Python的安装 目前市场上Python 2.X系列与Python 3.X系列共存的现象.读者可以安装Python 2.X系列或者Python 3.X系列.如果开发的目的是基于原有Python 2. ...

  8. python读取视频流做人脸识别_基于OpenCV和Keras实现人脸识别系列——二、使用OpenCV通过摄像头捕获实时视频并探测人脸、准备人脸数据...

    基于OpenCV和Keras实现人脸识别系列手记: 项目完整代码参见Github仓库. 本篇是上面这一系列手记的第二篇. 在Opencv初接触,图片的基本操作这篇手记中,我介绍了一些图片的基本操作,而 ...

  9. python手写答题卡识别_基于 Python OpenCV 的简易答题卡识别

    又有一个多月的时间了呢 = = 刚想起来还欠着一篇文章没写,趁着没忘干净赶紧补上 先上样卡(A4,扫描图片为600dpi) 整体并不是很复杂,但一口气手工切40+张也是够累,所以想办法自己写了个识别程 ...

最新文章

  1. 2021-08-27 分割之后mask在原图中提取出来(语义分割—实例分割)
  2. 软件项目管理0628:出差面临的问题
  3. 电大计算机应用基础考60,(2016年电大)电大计算机应用基础考答案.doc
  4. vmware ubuntu重置root密码
  5. Java基础知识(一)
  6. Redis简单案例(三) 连续登陆活动的简单实现
  7. python tkinter frame加入窗口_Python ---(五)Tkinter窗口组件:LabelFrame
  8. 电子签名市场,CA、混合云、SaaS三路混战
  9. Oracle MySQL sql 列转行 union all 实现
  10. DOS和Debug常用命令
  11. 移动端手指事件和手机事件:
  12. 2022年金砖国家职业技能大赛(决赛)网络空间安全赛项 | 浙江赛区选拔赛 任务书
  13. 【转】关系型数据库的设计范式 1NF 2NF 3NF BCNF
  14. Expected Error Reduction的缺点
  15. 不怕得罪人地推荐这9本黑客书籍
  16. TCP/IP协议栈之LwIP(六)---网络传输管理之TCP协议
  17. 玩手机惹怒丈夫 男子用菜刀砍死怀孕8个月妻子
  18. 为 Revit API 插件创建 WPF 窗口的基本项目(Revit API+WPF 系列 2/3)
  19. MiddleBury与SceneFlow 数据集相机参数与pfm文件解析
  20. New binary linear programming formulation to compute the graph edit distance 2015

热门文章

  1. 如何学习计算机视觉?
  2. 海数所观点:618电商直播狂欢下 为何商家却频频亏损
  3. SQLServer 2008中事务日志已满问题处理
  4. 圣朱妮佩洛|San Junipero(5)
  5. Java神操作之利用Mybatis的resultMap的id标签进行分组映射
  6. 销售易和纷享销客的“生存经”
  7. 2021-11-02 没羞没臊的商家装傻充愣昧着良知昧着基本人格耍赖达到丧心病狂程度.
  8. 扫雷 洛谷p2327
  9. 修改IDEA默认配置路径
  10. 可编程计算机边长计算器,可编程科学计算器(Scientific Calculator Plus)