import tensorflow as tf
import numpy as np
from tensorflow.keras import losses,optimizers,Sequential,layers,datasets
learn_rate=0.01#学习率
(x,y),(x_test,y_test)=datasets.mnist.load_data()#加载数据集
#塔建网络
network=Sequential([layers.Dense(256,activation='relu'),layers.Dense(128,activation='relu'),layers.Dense(10)])
#tf.keras.optimizers.SGD(learning_rate=5e-4) 声明了一个梯度下降 优化器 (Optimizer)
optimizer=tf.keras.optimizers.SGD(learn_rate)
with tf.GradientTape() as tape:#梯度记录器x=tf.reshape(x,[-1,28*28])#打平操作out=network(x)#将[b,28*28]->[b,10]y=tf.one_hot(y,depth=10)#转化为one_hot编码loss=tf.square(y-out)#计算误差loss=tf.reduce_sum(loss)/x.shape[0]#计算平均误差grades=tape.gradient(loss,network.trainable_variables)#自动求导
optimizer.apply_gradients(zip(grades,network.trainable_variables))#自动更新参数
print('w:{},b:{}'.format(grades[0],grades[1]))#查看参数情况
输出结果:
w:[[0. 0. 0. ... 0. 0. 0.][0. 0. 0. ... 0. 0. 0.][0. 0. 0. ... 0. 0. 0.]...[0. 0. 0. ... 0. 0. 0.][0. 0. 0. ... 0. 0. 0.][0. 0. 0. ... 0. 0. 0.]],b:[-3.11777830e+00  5.16500235e+00 -1.08968163e+01  1.87307587e+018.32014382e-01 -3.27148867e+00  2.07424793e+01 -2.38739729e+005.13981724e+00  6.06166601e+00 -1.28177843e+01 -6.19462204e+00-7.04542041e-01  3.13375187e+01  1.89351711e+01 -6.54731274e+009.35802841e+00  1.17674952e+01 -1.29999533e+01  1.36911840e+015.48811102e+00 -3.68861413e+00  3.88939095e+00  3.71513367e+009.55864727e-01  2.09348927e+01  1.13276129e+01  2.91512346e+00-1.61753254e+01  4.05063123e-01 -1.70540169e-01  2.46970539e+01-1.51269627e+00  7.76452303e+00 -1.91313922e+00  8.87538052e+003.01320291e+00  2.61218953e+00 -1.18211424e+00  3.21266632e+01-5.69417775e-01 -1.76080837e+01  1.63446474e+00 -6.77676725e+003.27574313e-01 -1.11655655e+01 -1.38191092e+00  7.79362440e-011.77140217e+01 -3.49355906e-01  1.36916566e+00  7.95150459e-011.33379149e+00  3.80156898e+00 -2.06344914e+00 -6.09201860e+002.52484436e+01  4.99165207e-02  7.17997074e+00 -1.04335213e+002.38907385e+00 -2.81740737e+00  1.99555177e-02 -8.28621387e-01-1.21862564e+01  1.29840136e+01  2.97094107e+00  4.26322126e+001.28332653e+01 -4.05574179e+00  1.72194503e-02  4.41505432e+00-3.89619395e-02  5.61785793e+00 -7.90942764e+00 -8.15391827e+003.68003845e-01 -1.70604992e+01  4.68355477e-01  6.36847258e+007.58416462e+00 -5.16527474e-01 -4.95719624e+00 -2.87812233e-016.98095465e+00  7.65936279e+00 -1.57963681e+00 -6.34466827e-012.03416138e+01  7.79924452e-01 -2.80444622e+00 -4.86203551e-011.09892654e+00 -4.94389772e+00  2.11732826e+01  4.67318249e+00-4.97272110e+00  1.69762707e+00  3.83693457e+00  2.06626105e+005.62190771e+00  3.29043503e+01 -1.26407731e+00 -1.02675915e+012.88683820e+00  2.88103676e+00 -6.10090876e+00  3.86420846e+00-3.50056577e+00  6.30561256e+00 -8.95971358e-01 -4.01228714e+00-1.39382286e+01 -8.93896580e+00  2.11841986e-01  3.37973142e+004.37175369e+00 -6.73379660e+00  3.82717061e+00 -1.25732327e+011.65040016e+00  6.10954463e-01 -6.71825884e-03 -6.70820618e+00-1.55312891e+01 -6.93888855e+00 -1.66754758e+00 -3.11373568e+002.79544544e+01  2.60159826e+00  9.09322643e+00  2.06872368e+005.10315371e+00 -6.82810992e-02  4.86091280e+00  1.44108057e+00-4.24769545e+00 -8.58117878e-01 -4.17315292e+00 -1.18891060e-01-2.87684059e+00  2.50076580e+00  1.21602602e+01  5.47460318e-01-2.66776800e+00  2.02684612e+01 -5.45302248e+00 -7.49153852e+007.15021551e-01 -2.52020669e+00  9.26999283e+00  1.22833407e+006.25356078e-01  2.14496446e+00 -3.09916425e+00 -4.65353299e-03-6.10701418e+00 -6.48929924e-02 -4.49325949e-01 -1.13467491e+00-3.41503024e-01  2.33511567e+00  3.92543435e+00 -2.40969324e+004.14333105e-01 -8.39614272e-01  5.12825251e+00 -9.30017567e+005.10950804e+00 -8.15231991e+00 -4.85511208e+00 -1.10248983e+00-6.35800743e+00  7.45321512e-01 -1.05755162e+00  9.66027021e-011.00393658e+01  2.18029737e+00 -9.60342789e+00  1.85279691e+002.39155083e+01  5.62503052e+00  3.52887988e+00 -1.46749198e+009.49217224e+00  2.55813909e+00  4.71623945e+00 -1.28027654e+00-3.26218039e-01 -5.70841742e+00  1.10409479e+01 -6.22563553e+007.46526098e+00  1.67952843e+01  3.59169170e-02 -5.17923212e+00-4.60196447e+00  6.32314014e+00 -5.75837946e+00  1.41040337e+00-2.88546443e+00 -2.36690938e-01  7.26947927e+00 -5.32344341e-011.00814085e+01 -1.33304615e+01 -9.51611900e+00  1.40035999e+001.91590748e+01  2.91998291e+00 -3.06685686e+00  3.87221789e+003.96515465e+00 -2.21689010e+00  1.51189842e+01  2.65303445e+004.62888813e+00  2.37765718e+00 -2.42385268e+00 -3.89299512e-01-2.09512264e-02 -4.70000887e+00  9.91910934e+00 -6.66291666e+002.78724217e+00 -6.40649796e+00 -5.05107753e-02  4.69428349e+00-4.21518421e+00 -7.04701328e+00 -1.08622742e+01 -8.35776711e+001.44581556e+01 -8.26097012e+00 -4.84640265e+00  1.35311956e+012.19240069e+00  1.87899075e+01 -1.61599293e+01  3.02137184e+001.47190309e+00 -3.67310047e+00  1.61656799e+01 -3.45745534e-01-4.23415852e+00  6.78260803e+00  9.82704818e-01 -7.16295421e-019.47604120e-01  5.95895946e-01  1.07781255e+00 -3.85220677e-011.96846581e+01 -1.56851076e-02 -1.18086135e+00 -1.05028939e+00]​

网络的塔建+模型训练相关推荐

  1. 深度学习模型训练技巧

    博主以前都是拿别人的模型别人的数据做做分类啊,做做目标检测,搞搞学习,最近由于导师的工程需求,自己构造网络,用自己的数据来跑网络,才发现模型训练真的是很有讲究,很有技巧在里面,最直接的几个超参数的设置 ...

  2. 【华为云技术分享】网络场景AI模型训练效率实践

    问题 在网络场景下的AI模型训练的过程中,KPI异常检测项目需要对设备内多模块.多类型数据,并根据波形以及异常表现进行分析,这样的数据量往往较大,对内存和性能要求较高. 同时,在设计优化算法时,需要快 ...

  3. 化合物分子 ogb、dgl生成图网络及GNN模型训练;pgl图框架

    参考:https://towardsdatascience.com/learn-to-smell-molecules-with-graph-convolutional-neural-networks- ...

  4. 推荐一款超级好用的AI模型训练平台——Tesra超算网络!

    2019独角兽企业重金招聘Python工程师标准>>> 作为一个刚接触AI行业的小萌新,好不容易做好了一个深度学习的模型,然后就兴冲冲的想要在我的电脑上做训练,自我感觉我的笔记本的性 ...

  5. AI模型训练无需购买设备啦!Tesar超算网络让AI模型训练更便捷!

    现代科技的发展可以用日新月异来形容,新技术的出现也是层出不穷.一个眨眼的功夫,一门足以改变世界的应用可能就被发明出来了,当然也有可能一个遥遥领先的企业瞬间被超越.处在风云变化时代,最重要的就是时间,就 ...

  6. 商汤首付56亿!上海建成亚洲最大AI“发电厂”,万亿参数大模型训练无压力

    梦晨 萧箫 发自 凹非寺 量子位 | 公众号 QbitAI 刚刚,商汤又多了一项"亚洲第一". 就在上海临港,商汤自建的人工智能计算中心(AIDC)交付使用,一举成为亚洲最大的AI ...

  7. 【火炉炼AI】深度学习003-构建并训练深度神经网络模型

    [火炉炼AI]深度学习003-构建并训练深度神经网络模型 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit-learn 0.19, matplotl ...

  8. 如何借助分布式存储 JuiceFS 加速 AI 模型训练

    传统的机器学习模型,数据集比较小,模型的算法也比较简单,使用单机存储,或者本地硬盘就足够了,像 JuiceFS 这样的分布式存储并不是必需品. 随着近几年深度学习的蓬勃发展,越来越多的团队开始遇到了单 ...

  9. 谷歌大规模机器学习:模型训练、特征工程和算法选择 (32PPT下载)

    本文转自:http://mp.weixin.qq.com/s/Xe3g2OSkE3BpIC2wdt5J-A 谷歌大规模机器学习:模型训练.特征工程和算法选择 (32PPT下载) 2017-01-26  ...

最新文章

  1. 对Document library中修改文档的Author之实现修改在list(三)
  2. 一个游戏客户端文件的字节加解密代码,我花1000元请人解的,存在这,以后应该用得到。...
  3. Apache Common HttpClient使用之七种武器
  4. ontological 词根词缀_英语中最常见的词缀(一)之 re
  5. 基础知识:编程语言介绍、Python介绍、Python解释器安装、运行Python解释器的两种方式、变量、数据类型基本使用
  6. oracle查询中表的连接顺序 手工指定
  7. android ButterKnife的简单使用
  8. perl大骆驼和小骆驼_你好骆驼:自动文件传输
  9. 01屏幕增强 sap_SAP (MM01 MM02 MM03)屏幕增强
  10. 数据3分钟丨墨天轮2021年度数据库奖项及中国数据库魔力象限等多项成果发布...
  11. 案例:对比使用Java代码与EL表达式获取信息
  12. C4D插件X-Particles粒子特效(三)
  13. 离线安装docker
  14. uni-app实战之社区交友APP(12)文章和话题API开发
  15. 场景分析法设计测试用例
  16. 配置mysql数据库端口号_数据库配置时要注意端口号
  17. js实现video视频标签试看6分钟
  18. java swing桌面程序打包成.exe文件
  19. serv-u ftp server是什么?如何利用花生壳搭建ftp服务器?
  20. linux中使用redshift进行防蓝光

热门文章

  1. python之互斥锁
  2. 笔记 | PyTorch张量Tensor的一些必备操作
  3. 基于转移学习的图像识别
  4. iOS 的组件化开发
  5. 300 Longest Increasing Subsequence
  6. 在64位的环境中使用VS建立Web项目进行Oracle连接需要注意WebDev是32位的
  7. Mysql探究之null与not null
  8. Django 各类配置选项全集
  9. X86中的RDTSC指令
  10. android c/c++ eclipse 绿色版 环境的配置