网络的塔建+模型训练
import tensorflow as tf
import numpy as np
from tensorflow.keras import losses,optimizers,Sequential,layers,datasets
learn_rate=0.01#学习率
(x,y),(x_test,y_test)=datasets.mnist.load_data()#加载数据集
#塔建网络
network=Sequential([layers.Dense(256,activation='relu'),layers.Dense(128,activation='relu'),layers.Dense(10)])
#tf.keras.optimizers.SGD(learning_rate=5e-4) 声明了一个梯度下降 优化器 (Optimizer)
optimizer=tf.keras.optimizers.SGD(learn_rate)
with tf.GradientTape() as tape:#梯度记录器x=tf.reshape(x,[-1,28*28])#打平操作out=network(x)#将[b,28*28]->[b,10]y=tf.one_hot(y,depth=10)#转化为one_hot编码loss=tf.square(y-out)#计算误差loss=tf.reduce_sum(loss)/x.shape[0]#计算平均误差grades=tape.gradient(loss,network.trainable_variables)#自动求导
optimizer.apply_gradients(zip(grades,network.trainable_variables))#自动更新参数
print('w:{},b:{}'.format(grades[0],grades[1]))#查看参数情况
输出结果:
w:[[0. 0. 0. ... 0. 0. 0.][0. 0. 0. ... 0. 0. 0.][0. 0. 0. ... 0. 0. 0.]...[0. 0. 0. ... 0. 0. 0.][0. 0. 0. ... 0. 0. 0.][0. 0. 0. ... 0. 0. 0.]],b:[-3.11777830e+00 5.16500235e+00 -1.08968163e+01 1.87307587e+018.32014382e-01 -3.27148867e+00 2.07424793e+01 -2.38739729e+005.13981724e+00 6.06166601e+00 -1.28177843e+01 -6.19462204e+00-7.04542041e-01 3.13375187e+01 1.89351711e+01 -6.54731274e+009.35802841e+00 1.17674952e+01 -1.29999533e+01 1.36911840e+015.48811102e+00 -3.68861413e+00 3.88939095e+00 3.71513367e+009.55864727e-01 2.09348927e+01 1.13276129e+01 2.91512346e+00-1.61753254e+01 4.05063123e-01 -1.70540169e-01 2.46970539e+01-1.51269627e+00 7.76452303e+00 -1.91313922e+00 8.87538052e+003.01320291e+00 2.61218953e+00 -1.18211424e+00 3.21266632e+01-5.69417775e-01 -1.76080837e+01 1.63446474e+00 -6.77676725e+003.27574313e-01 -1.11655655e+01 -1.38191092e+00 7.79362440e-011.77140217e+01 -3.49355906e-01 1.36916566e+00 7.95150459e-011.33379149e+00 3.80156898e+00 -2.06344914e+00 -6.09201860e+002.52484436e+01 4.99165207e-02 7.17997074e+00 -1.04335213e+002.38907385e+00 -2.81740737e+00 1.99555177e-02 -8.28621387e-01-1.21862564e+01 1.29840136e+01 2.97094107e+00 4.26322126e+001.28332653e+01 -4.05574179e+00 1.72194503e-02 4.41505432e+00-3.89619395e-02 5.61785793e+00 -7.90942764e+00 -8.15391827e+003.68003845e-01 -1.70604992e+01 4.68355477e-01 6.36847258e+007.58416462e+00 -5.16527474e-01 -4.95719624e+00 -2.87812233e-016.98095465e+00 7.65936279e+00 -1.57963681e+00 -6.34466827e-012.03416138e+01 7.79924452e-01 -2.80444622e+00 -4.86203551e-011.09892654e+00 -4.94389772e+00 2.11732826e+01 4.67318249e+00-4.97272110e+00 1.69762707e+00 3.83693457e+00 2.06626105e+005.62190771e+00 3.29043503e+01 -1.26407731e+00 -1.02675915e+012.88683820e+00 2.88103676e+00 -6.10090876e+00 3.86420846e+00-3.50056577e+00 6.30561256e+00 -8.95971358e-01 -4.01228714e+00-1.39382286e+01 -8.93896580e+00 2.11841986e-01 3.37973142e+004.37175369e+00 -6.73379660e+00 3.82717061e+00 -1.25732327e+011.65040016e+00 6.10954463e-01 -6.71825884e-03 -6.70820618e+00-1.55312891e+01 -6.93888855e+00 -1.66754758e+00 -3.11373568e+002.79544544e+01 2.60159826e+00 9.09322643e+00 2.06872368e+005.10315371e+00 -6.82810992e-02 4.86091280e+00 1.44108057e+00-4.24769545e+00 -8.58117878e-01 -4.17315292e+00 -1.18891060e-01-2.87684059e+00 2.50076580e+00 1.21602602e+01 5.47460318e-01-2.66776800e+00 2.02684612e+01 -5.45302248e+00 -7.49153852e+007.15021551e-01 -2.52020669e+00 9.26999283e+00 1.22833407e+006.25356078e-01 2.14496446e+00 -3.09916425e+00 -4.65353299e-03-6.10701418e+00 -6.48929924e-02 -4.49325949e-01 -1.13467491e+00-3.41503024e-01 2.33511567e+00 3.92543435e+00 -2.40969324e+004.14333105e-01 -8.39614272e-01 5.12825251e+00 -9.30017567e+005.10950804e+00 -8.15231991e+00 -4.85511208e+00 -1.10248983e+00-6.35800743e+00 7.45321512e-01 -1.05755162e+00 9.66027021e-011.00393658e+01 2.18029737e+00 -9.60342789e+00 1.85279691e+002.39155083e+01 5.62503052e+00 3.52887988e+00 -1.46749198e+009.49217224e+00 2.55813909e+00 4.71623945e+00 -1.28027654e+00-3.26218039e-01 -5.70841742e+00 1.10409479e+01 -6.22563553e+007.46526098e+00 1.67952843e+01 3.59169170e-02 -5.17923212e+00-4.60196447e+00 6.32314014e+00 -5.75837946e+00 1.41040337e+00-2.88546443e+00 -2.36690938e-01 7.26947927e+00 -5.32344341e-011.00814085e+01 -1.33304615e+01 -9.51611900e+00 1.40035999e+001.91590748e+01 2.91998291e+00 -3.06685686e+00 3.87221789e+003.96515465e+00 -2.21689010e+00 1.51189842e+01 2.65303445e+004.62888813e+00 2.37765718e+00 -2.42385268e+00 -3.89299512e-01-2.09512264e-02 -4.70000887e+00 9.91910934e+00 -6.66291666e+002.78724217e+00 -6.40649796e+00 -5.05107753e-02 4.69428349e+00-4.21518421e+00 -7.04701328e+00 -1.08622742e+01 -8.35776711e+001.44581556e+01 -8.26097012e+00 -4.84640265e+00 1.35311956e+012.19240069e+00 1.87899075e+01 -1.61599293e+01 3.02137184e+001.47190309e+00 -3.67310047e+00 1.61656799e+01 -3.45745534e-01-4.23415852e+00 6.78260803e+00 9.82704818e-01 -7.16295421e-019.47604120e-01 5.95895946e-01 1.07781255e+00 -3.85220677e-011.96846581e+01 -1.56851076e-02 -1.18086135e+00 -1.05028939e+00]
网络的塔建+模型训练相关推荐
- 深度学习模型训练技巧
博主以前都是拿别人的模型别人的数据做做分类啊,做做目标检测,搞搞学习,最近由于导师的工程需求,自己构造网络,用自己的数据来跑网络,才发现模型训练真的是很有讲究,很有技巧在里面,最直接的几个超参数的设置 ...
- 【华为云技术分享】网络场景AI模型训练效率实践
问题 在网络场景下的AI模型训练的过程中,KPI异常检测项目需要对设备内多模块.多类型数据,并根据波形以及异常表现进行分析,这样的数据量往往较大,对内存和性能要求较高. 同时,在设计优化算法时,需要快 ...
- 化合物分子 ogb、dgl生成图网络及GNN模型训练;pgl图框架
参考:https://towardsdatascience.com/learn-to-smell-molecules-with-graph-convolutional-neural-networks- ...
- 推荐一款超级好用的AI模型训练平台——Tesra超算网络!
2019独角兽企业重金招聘Python工程师标准>>> 作为一个刚接触AI行业的小萌新,好不容易做好了一个深度学习的模型,然后就兴冲冲的想要在我的电脑上做训练,自我感觉我的笔记本的性 ...
- AI模型训练无需购买设备啦!Tesar超算网络让AI模型训练更便捷!
现代科技的发展可以用日新月异来形容,新技术的出现也是层出不穷.一个眨眼的功夫,一门足以改变世界的应用可能就被发明出来了,当然也有可能一个遥遥领先的企业瞬间被超越.处在风云变化时代,最重要的就是时间,就 ...
- 商汤首付56亿!上海建成亚洲最大AI“发电厂”,万亿参数大模型训练无压力
梦晨 萧箫 发自 凹非寺 量子位 | 公众号 QbitAI 刚刚,商汤又多了一项"亚洲第一". 就在上海临港,商汤自建的人工智能计算中心(AIDC)交付使用,一举成为亚洲最大的AI ...
- 【火炉炼AI】深度学习003-构建并训练深度神经网络模型
[火炉炼AI]深度学习003-构建并训练深度神经网络模型 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit-learn 0.19, matplotl ...
- 如何借助分布式存储 JuiceFS 加速 AI 模型训练
传统的机器学习模型,数据集比较小,模型的算法也比较简单,使用单机存储,或者本地硬盘就足够了,像 JuiceFS 这样的分布式存储并不是必需品. 随着近几年深度学习的蓬勃发展,越来越多的团队开始遇到了单 ...
- 谷歌大规模机器学习:模型训练、特征工程和算法选择 (32PPT下载)
本文转自:http://mp.weixin.qq.com/s/Xe3g2OSkE3BpIC2wdt5J-A 谷歌大规模机器学习:模型训练.特征工程和算法选择 (32PPT下载) 2017-01-26 ...
最新文章
- 对Document library中修改文档的Author之实现修改在list(三)
- 一个游戏客户端文件的字节加解密代码,我花1000元请人解的,存在这,以后应该用得到。...
- Apache Common HttpClient使用之七种武器
- ontological 词根词缀_英语中最常见的词缀(一)之 re
- 基础知识:编程语言介绍、Python介绍、Python解释器安装、运行Python解释器的两种方式、变量、数据类型基本使用
- oracle查询中表的连接顺序 手工指定
- android ButterKnife的简单使用
- perl大骆驼和小骆驼_你好骆驼:自动文件传输
- 01屏幕增强 sap_SAP (MM01 MM02 MM03)屏幕增强
- 数据3分钟丨墨天轮2021年度数据库奖项及中国数据库魔力象限等多项成果发布...
- 案例:对比使用Java代码与EL表达式获取信息
- C4D插件X-Particles粒子特效(三)
- 离线安装docker
- uni-app实战之社区交友APP(12)文章和话题API开发
- 场景分析法设计测试用例
- 配置mysql数据库端口号_数据库配置时要注意端口号
- js实现video视频标签试看6分钟
- java swing桌面程序打包成.exe文件
- serv-u ftp server是什么?如何利用花生壳搭建ftp服务器?
- linux中使用redshift进行防蓝光