R语言h2o深度学习分类
配置所需环境:
install.packages("h2o")
library(h2o)
Sys.setenv(JAVA_HOME="E:/java/JAVA(1)") -----配置环境变量
h2o.init() #链接h2o平台
下载数据:
训练集: http://www.pjreddie.com/media/files/mnist_train.csv
测试集: http://www.pjreddie.com/media/files/mnist_test.csv
train_h2o <- h2o.importFile( path = "D:/mnist_train.csv")
test_h2o <- h2o.importFile(path = "D:/mnist_test.csv")
y_train <- as.factor(as.matrix(train_h2o[, 1]))
y_test <- as.factor(as.matrix(test_h2o[, 1]))
训练模型:
model <- h2o.deeplearning(x = 2:785, # column numbers for predictors
y = 1, # column number for label
training_frame = train_h2o, 训练集
activation = "Tanh", #激活函数
#balance_classes = TRUE, #训练集类别均衡
hidden = c(100, 100, 100), ## three hidden layers
epochs = 100) #迭代100次
由于数据规模比较大,是60000行*785列的,所以这个过程中电脑会变的巨卡,cpu使用量会持续95%以上,我的电脑持续了40分钟才训练完模型
接下来你可以输出模型来看看你的训练集的训练效果如何
model
Model Details:
==============
H2ORegressionModel: deeplearning
Model ID: DeepLearning_model_R_1500974326986_4
Status of Neuron Layers: predicting C1, regression, gaussian distribution, Quadratic loss, 92,101 weights/biases, 1.1 MB, 862,830 training samples, mini-batch size 1
layer units type dropout l1 l2 mean_rate rate_rms momentum
1 1 717 Input 0.00 %
2 2 100 Tanh 0.00 % 0.000000 0.000000 0.352263 0.377816 0.000000
3 3 100 Tanh 0.00 % 0.000000 0.000000 0.050956 0.026576 0.000000
4 4 100 Tanh 0.00 % 0.000000 0.000000 0.233008 0.247813 0.000000
5 5 1 Linear 0.000000 0.000000 0.001606 0.001025 0.000000
mean_weight weight_rms mean_bias bias_rms
1
2 -0.002465 0.110346 0.016357 0.192539
3 0.001666 0.177409 0.002860 0.447464
4 -0.002143 0.154353 -0.017609 0.236047
5 -0.012989 0.069333 -0.056454 0.000000
H2ORegressionMetrics: deeplearning
** Reported on training data. **
** Metrics reported on temporary training frame with 10092 samples **
MSE: 0.1165795
RMSE: 0.3414374
MAE: 0.1600576
RMSLE: 0.09332472
Mean Residual Deviance : 0.1165795
然后来看一下测试集分类效果如何,我们把训练的模型拿来预测测试集:
yhat_train <- h2o.predict(model, train_h2o)$predict
yhat_train <- as.factor(as.matrix(yhat_train))
yhat_test <- h2o.predict(model, test_h2o)$predict
yhat_test <- as.factor(as.matrix(yhat_test))
yt<-as.numeric(as.character(y_test)) #将因子现转字符再转数值
yhat<-as.numeric(as.character(yhat_test))
执行以下代码可以输出分类的正确个数
s<-0
for(i in 1:10000)
{
if(yt[i]==round(yhat[i]))
s<-s+1
}
s
[1] 8964
预测成功8964个,正确率为89.64%,效果还算不错
R语言h2o深度学习分类相关推荐
- R语言︱H2o深度学习的一些R语言实践——H2o包
每每以为攀得众山小,可.每每又切实来到起点,大牛们,缓缓脚步来俺笔记葩分享一下吧,please~ --------------------------- R语言H2o包的几个应用案例 笔者寄语:受启发 ...
- 碎片︱R语言与深度学习
笔者:受alphago影响,想看看深度学习,但是其在R语言中的应用包可谓少之又少,更多的是在matlab和python中或者是调用.整理一下目前我看到的R语言的材料: ---------------- ...
- R语言 深圳 面授_「深圳侦探电话」用R语言实现深度学习情感分析
04-16阅读数466 作者:黄天元,复旦大学博士在读,目前研究涵盖文本挖掘.社交网络预测和机器学习等.希望与你们分享学习心得,推广并加深R语言在业界的应用.邮箱:huang.tian-yuan... ...
- R语言快速深度学习进行回归预测(转)
深度学习在过去几年,由于卷积神经网络的特征提取能力让这个算法又火了一下,其实在很多年以前早就有所出现,但是由于深度学习的计算复杂度问题,一直没有被广泛应用. 一般的,卷积层的计算形式为: 其中.x分别 ...
- 极限学习机︱R语言快速深度学习进行回归预测
本文转载于张聪的博客,链接:https://ask.hellobi.com/blog/zason/4543. 深度学习在过去几年,由于卷积神经网络的特征提取能力让这个算法又火了一下,其实在很多年以前早 ...
- R语言与机器学习学习笔记(分类算法)
转载自:http://www.itongji.cn/article/0P534092014.html 人工神经网络(ANN),简称神经网络,是一种模仿生物神经网络的结构和功能的数学模型或计算模型.神经 ...
- 语言 提取列名_学习健明老师发布的R语言练习题的学习笔记(二)
学习者:骆栢维 题目来源:生信基石之R语言 中级10 个题目:http://www.bio-info-trainee.com/3750.html 备注:本文为笔者学习健明老师GitHub答案代码的学习 ...
- 【C语言进阶深度学习记录】五 C语言中变量的属性
上一篇文章学习了C语言中的类型转换,点击链接查看:[C语言进阶深度学习记录]四 C语言中的类型转换. 文章目录 1 C语言的变量属性 1.1 auto关键字 1.2 register关键字 1.3 s ...
- 深度学习分类任务常用评估指标
摘要:这篇文章主要向大家介绍深度学习分类任务评价指标,主要内容包括基础应用.实用技巧.原理机制等方面,希望对大家有所帮助. 本文分享自华为云社区<深度学习分类任务常用评估指标>,原文作者: ...
最新文章
- 带你「周游世界」的 MODNet 算法
- 怎么样设置关闭网页再次登录网页是正常登录状态_学籍系统出现“该账号已登录,不能重复登录”怎么办?...
- linux 清空catalina.out日志 不需要重启tomcat(五种方法)【转】
- 【Linux网络编程】网络协议入门
- eclipse maven 项目发布到tomcat 报错 Failed to scan JAR [file:/C:/xxxxx.jar] from WEB-INF/lib
- Python爬虫学习round01
- java zip ant 密码_java对 zip文件的压缩和解压(ant解决中文乱码)
- layout_gravity和gravity的区别
- 数字电路与系统-知识点2
- 【小窍门tip】oracle sequence 修改增量值
- OFFICE InfoPath 教程
- signature=4a882a48c4a4b2b41835e11b6fafa69f,ABB 38SC980002R375
- From CodingHorror: The Long, Dismal History of ...
- 看了后非常震撼---骗局
- 三大运营商(联通、电信、移动)的手机号正则判断
- 提升Facebook触及率和互动率攻略 | 智能客服帮您抓住用户的心
- 计算机专业名称bios翻译,电脑BIOS中英文对照翻译有哪些?
- Pandas数据分析工具快速进阶三(value_counts与apply结合使用简单的统计函数)
- argparse简化版图片教程
- UVaLive 4868 Palindrometer (暴力 / 构造)