在这篇文章中,我展示了使用H2o.ai框架的机器学习,使用R语言进行股票价格预测的分步方法。 该框架也可以在Python中使用,但是,由于我对R更加熟悉,因此我将以该语言展示该教程。 您可能已经问过自己:如何使用人工智能预测股价? 这是执行此操作的步骤:

收集资料

导入数据

清理和处理数据

分开进行测试和培训观察

选择型号

训练模型

将模型应用于测试数据

评估结果

必要时增强模型

重复步骤5至10,直到对结果满意为止。

在上一篇文章中,我展示了如何使用Plotly库绘制高频数据,并解释了如何收集数据以进行分析。 让我们直接跳到列表中的第3步,如果您想知道如何执行第1步和第2步,请访问上一本出版物。

我们的研究问题是:"下一个小时资产的收盘价是多少?"

数据清理

导入要使用MetaTrader进行预测的资产数据后,我们需要更改一些变量。 首先,我们定义变量的名称:

#seting thenameofvariables

col_names

colnames(data)

我们的数据将采用以下形式:

> Data — Image by Author

我们将仅使用一些可用变量:开盘价,最高价,最低价,收盘价和交易量。 这样,我们将消除其他人。

data$Date

data$Tick

由于我们想知道下一次观察的收盘价,因此我们需要将以下值移动到上方一行。 为此,我们创建一个函数并使用新数据在原始数据集中创建一个变量:

#shifting nrowsupofa given variableshift

> Data — Image by Author

注意,我们在上面的第一行分配了变量Close的值。 这样,我们在最后一行有一个NA,我们使用na.omit()函数来省略该行:

#remove NA observationsdata

完美,我们已准备好数据来开始建模。

分割数据

在此问题中,我们将使用名为H2O.ai的软件包,该软件包为我们提供了用于分析和训练人工智能模型的完整解决方案。 其用户友好的结构使没有数据科学背景的人们能够解决复杂的问题。 首先将库加载到我们的环境中:

#Installing the packageinstall.packages("h2o")#loading the library library(h2o)

安装和加载后,我们将启动虚拟机,该虚拟机将用作构建模型的基础。 启动虚拟机时,我们必须设置所需的内核数和内存参数:

#Initializing the Virtual Machine usingallthe threads (-1)and16gbofmemoryh2o.init(nthreads = -1, max_mem_size ="16g")

导入数据:

h2o.importFile("data.csv")h2o.describe(data)

> Data into h2o — Image by Author

现在,我们定义我们要在数据集中预测的变量以及将用于"教导"模型的变量。

y

然后,我们按训练数据的80%的比例将数据分为训练和测试。

parts

分割数据后,我们转到H2O.ai软件包不可思议的部分。

选择模型

每个数据科学家在创建其机器学习项目时需要执行的任务之一就是确定最佳模型或一组模型以进行预测。 这需要大量的知识,尤其是扎实的数学基础,才能为特定任务选择最佳知识。

借助H2O.ai软件包,我们可以要求它为我们选择最佳模型,同时还要照顾其他任何问题。 这称为自动建模。 显然,这种魔力可能不是解决问题的最有效方法,但这是一个好的开始。

训练模型

要创建我们的模型,我们调用automl函数并传递必要的参数,如下所示:

automodel

几分钟后,我们将获得按性能排序的模型列表。 要了解有关它们的更多信息,请致电:

automodel@leader

> Model Description — Image by Author

应用模型

现在我们有了领导者,让我们将其应用于测试数据! 这是最酷的部分,因为我们将使用模型尚未观察到的数据来评估性能。

我们将模型和测试数据作为参数调用预测函数!

predictions

结论

在这篇文章中,我们看到了如何处理和操纵资产的财务数据,并轻松创建了机器学习模型,以便在分析数据后的一小时内对收盘价做出预测。

该模型的评估和优化将在下一篇文章中进行。

下周见!

【编辑推荐】

【责任编辑:华轩 TEL:(010)68476606】

点赞 0

python预测股票价格_使用机器学习预测股票价格的愚蠢简便方法相关推荐

  1. python天气预测算法_使用机器学习预测天气(第二部分)

    概述 这篇文章我们接着前一篇文章,使用Weather Underground网站获取到的数据,来继续探讨用机器学习的方法预测内布拉斯加州林肯市的天气 上一篇文章我们已经探讨了如何收集.整理.清洗数据. ...

  2. 机器学习 预测 交通_使用机器学习预测交通事故

    机器学习 预测 交通 Road accidents constitute a significant proportion of the number of serious injuries repo ...

  3. 基于python对天气的预测_使用机器学习预测天气(第一部分)

    概述 本章是使用机器学习预测天气系列教程的第一部分,使用Python和机器学习来构建模型,根据从Weather Underground收集的数据来预测天气温度.该教程将由三个不同的部分组成,涵盖的主题 ...

  4. python预测糖尿病_使用机器学习的算法预测皮马印第安人糖尿病

    皮马印第安人糖尿病预测 pima_diabetes_analysis_and_prediction 文件夹: data --> 存储原始样本 和 数据清洗后的样本 data_analysis_a ...

  5. 使用机器学习预测天气_使用机器学习的二手车价格预测

    使用机器学习预测天气 You can reach all Python scripts relative to this on my GitHub page. If you are intereste ...

  6. fitbit手表中文说明书_使用机器学习预测Fitbit睡眠分数

    fitbit手表中文说明书 In Part 1 of this article I explained how we can obtain sleep data from Fitbit, load i ...

  7. 使用机器学习预测天气_使用机器学习来预测患者是否会再次入院

    使用机器学习预测天气 We are in a age where machines are utilizing huge data and trying to create a better worl ...

  8. python预测糖尿病_实战 | 糖尿病预测项目

    项目介绍 这次我们要学习的项目是糖尿病的预测,数据保存在diabetes.csv文件中.数据一共有8个特征和1个标签: Pregnancies:怀孕次数Glucose:葡萄糖测试值BloodPress ...

  9. 时间序列预测 预测时间段_应用时间序列预测:美国住宅

    时间序列预测 预测时间段 1.简介 (1. Introduction) During these COVID19 months housing sector is rebounding rapidly ...

最新文章

  1. g5420核显驱动win7_9102年了,该怎么装Win7 ???
  2. ARM处理器工作模式
  3. html超链接点不了_HTML、CSS、JS都有哪些区别?不看必悔
  4. 显卡、显卡驱动、CUDA、CUDA Toolkit、cuDNN 梳理
  5. Tensorflow中卷积的padding操作
  6. MySQL日期格式符
  7. 评分模型前奏:启发式评分模型开发
  8. 关于COM的Reg-Free(免注册)技术简介及实例讲解。
  9. 5g组网sa方式的演进_关于5G的SA(独立组网)和NSA(非独立组网),这篇通俗易懂!
  10. matlab函数sinh,matlab sinh 使用方法
  11. 『TensorFlow』TFR数据预处理探究以及框架搭建
  12. 【强化学习】悬崖寻路:Sarsa和Q-Learning
  13. vue引入组件路径报错“Already included file name ”
  14. Android 最全 BATJ 大厂面试题整理!
  15. html点击弹出文本框,html制作,点击文字超链接显示文本框,再点击文字超链接隐藏文本框...
  16. 001-查看ts版本、安装、卸载
  17. 嵌入式软件测试(黑盒测试)-----三年嵌入式软件测试的理解
  18. Bootstrap入门使用
  19. HTTTP协议之POST和GEG区别
  20. Part6:客户端和服务端信息交互模型

热门文章

  1. 2020年985大学计算机分数线,2020年最新211和985大学名单录取分数线是多少
  2. 计算机科学与技术专业学生规划,计算机科学与技术专业认识与规划.docx
  3. Windows系统设置自动开机
  4. C语言 一球从100米高度自由落下,每次落地后反跳回原高度的一半; 再落下,求它在第10次落地时,共经过多少米?第10次反弹多高?
  5. 沟通新法则:请不要一个人吃饭
  6. php 红宝石,红宝石-世界名贵宝石排行榜-天天排行网
  7. 我的QT Creator学习笔记(二十一)——Qt国际化和Qt插件
  8. Flink实战(九十三):数据倾斜(二)keyby 窗口数据倾斜的优化
  9. nginx-基础知识
  10. Python 有趣的囚犯问题