整图下沉,MindSpore图引擎详解
2020-04-27 18:36:59
4 月 26 日,机器之心联合华为昇腾学院开设的线上公开课《轻松上手开源框架 MindSpore》第二课完成,GraphEngine 高级工程师王俊为大家带来了主题分享《MindSpore 中 GraphEngine 浅析》。
第二课精选问答
在第二课的 QA 环节中,有一些问题被大家广泛提到,王俊讲师再次做了精选与编辑,供大家参考。
Q1:循环下沉是什么?
循环下沉是在on-device执行的基础上更进一步的一个技巧,意图进一步建校host侧和device侧之间的交互次数。一般情况下,我们习惯于每个step都返回一个结果,循环下沉是控制每隔多少个step返回一次结果,缺省的配置是一个epoch返回一次结果,这样每个epoch里,host侧和device侧只需要进行一次数据交互即可。
Q2:FusionOP是定义在device上么?
FusionOP对应的具体算子是有其算子实现的,存储在算子信息库中,融合出fusionOP的过程是在host侧的CPU上完成,运行此FusionOP是在device上。
Q3:profiling只能在昇腾上用吗?
只能在升腾上使用。
Q4:profiling有op的开始时间吗?
profiling是记录下op开始和结束的时间,以此计算算子耗时。
Q5:数据dump是能dump出来什么数据呀
通过配置可以dump出任何存在在网络中的数据,每一个算子的输入输出,每一个parameter的值和梯度都可以被dump下来。
Q6: 910支持推理吗?支持多少op呢
910支持训练及推理,310只支持推理。目前我们的算子信息库已经相对完善,常用的op基本都已支持,如果有自定义算子的需求,我们提供了TBE工具来支持用户自定义算子的开发。
Q7:算子在不同的加速器上的调度策略什么?
在图准备阶段会根据代价函数进行算子引擎分配,在流分配阶段也会充分考虑不同算子之间的并行计算可能,具体指定每个算子的执行引擎。
Q8: GE是mindspore中和硬件交互的
是的,GE专门负责和Ascend芯片交互。
Q9:310不能做训练么?
310只能做推理,MindSpore训练好后的模型,将其固化为pb格式后,可以部署到310芯片上进行推理。
Q10:如何自定义升腾芯片支持的op呢?
提供了Tensor Boost Engine这个工具来支持自定义op。Ascend芯片的算子需要用一种cce格式的代码编写,需要显式指定内存搬运操作,极为复杂,使用tbe工具,只需调用其python接口完成算子逻辑定义,即可生成可运行在Ascend上的自定义算子。
大家后续如有更多问题,欢迎关注 MindSpore 的gitee和github,随时提 issue,官方人员将及时为大家解答:
- Gitee:https://gitee.com/mindspore
- GitHub:https://github.com/mindspore-ai
第二课PPT如下:
整图下沉,MindSpore图引擎详解相关推荐
- UML类图与类的关系详解
UML类图与类的关系详解 2011-04-21 来源:网络 在画类图的时候,理清类和类之间的关系是重点.类的关系有泛化(Generalization).实现(Realization).依赖(D ...
- ML之shap:分析基于shap库生成的力图、鸟瞰图、散点图等可视化图的坐标与内容详解之详细攻略
ML之shap:分析基于shap库生成的力图.鸟瞰图.散点图等可视化图的坐标与内容详解之详细攻略 目录 一.力图可视化 1.单个样本力图可视化
- Py之seaborn:数据可视化seaborn库(三)的矩阵图可视化之jointplot/JointGrid/pairplot/PairGrid/FacetGrid密度图等的函数源代码详解之最强攻略
Py之seaborn:数据可视化seaborn库(三)的矩阵图可视化之jointplot/JointGrid/pairplot/PairGrid/FacetGrid折线图/柱状图+散点图/矩形密度图的 ...
- CRY ENGINE 3 引擎详解
转载的. CRY ENGINE 3 引擎详解 "在今年,2009 年CRYTEK 宣布 CRY ENGINE 成功的移植到了家用机的 PS3 以及 Xbox360 平台,在 GDC2009 ...
- 如何查看mysql数据库的引擎/MySQL数据库引擎详解
一般情况下,mysql会默认提供多种存储引擎,你可以通过下面的查看: 看你的mysql现在已提供什么存储引擎: mysql> show engines; 看你的mysql当前默认的存储引擎: m ...
- MySQL常用存储引擎详解
MySQL常用存储引擎详解 一.什么是存储引擎 二.掌握存储引擎的重要性 三.MySQL常用的存储引擎有哪些 四.存储引擎的特性 1.InnoDB 2.MyISAM 3.MEMORY 4.ARCHIV ...
- 战地3寒霜2引擎详解:地形与后期处理技术特性
之前看过了zXr0带来的两篇寒霜2引擎技术解析么? <战地3>寒霜2引擎渲染流程图文详解 http://pc.07073.com/bf3/frostbite/14097.html ...
- [转]战地3寒霜2引擎详解:地形与后期处理技术特性
之前看过了zXr0带来的两篇寒霜2引擎技术解析么? <战地3>寒霜2引擎渲染流程图文详解 http://pc.07073.com/bf3/frostbite/14097.html ...
- Mysql存储引擎详解(MyISAM与InnoDB的区别)
Mysql存储引擎详解(MyISAM与InnoDB的区别) 存储引擎 MySQL中的数据用各种不同的技术存储在文件(或者内存)中.这些技术中的每一种技术都使用不同的存储机制.索引技巧.锁定水平 ...
- python 规则引擎 drools_Drools规则引擎详解-常用的drl实例
关于Drools规则引擎,之前已经写了几篇相关文章,如果大家不熟悉的可以移步了解下: 本篇博客主要为大家列举一些常用,简单的drl文件,帮助大家更加深入地了解其drl文件地编写格式及常用的操作符 说明 ...
最新文章
- Java String.split()用法小结
- 用Python读取整个文件
- docker镜像为什么要采用分层结构
- Uno 平台 一 WinUI终极跨平台方案(二)
- console 速查手册
- python 编译器pyc_有没有办法知道哪个Python版本.pyc文件被编译?
- struck在c语言中的作用,C语言-选择题及答案.doc
- python3 zip()函数笔记
- jquery插件实现分页
- clover config_【兵哥小课堂】不借助任何工具将CLOVER引导添加进UEFI的正确姿势
- 【MySQL】简单易学的MySQL安装教程
- Ubuntu 设置固定ip地址
- jsp酒店客房预订系统带前端
- Stencil计算GPU性能建模
- 虚幻4渲染编程(环境模拟篇)【第二卷:体积云天空模拟(2)---3D体纹理低云】...
- 计算机考试综合模块怎么做,《综合素质》几大模块备考指导要知道!
- java代码实现pdf按页拆分以及合并
- acwing数据结构笔记(一)
- 计算机开启时提示键盘错误,进入BIOS自检找不到键盘提示Keyboard error怎么办
- python读写csv常用方法
热门文章
- ftp 文件完整性校验_FTP空间是什么?如何获取免费FTP空间吗?
- python动态数组的最大值_python实现动态数组的示例代码
- 手机如何开启热点 转
- Seq2Seq (Attention) 的 PyTorch 实现 我的理想是数学家的博客,很详细实现过程
- AI Drive 直播 | Objects365物体检测及CrowdHuman人体检测挑战赛线上颁奖
- 《连线》| 李开复:新冠大流行将加速医疗AI革新
- 专访朱雷:昔日的游戏少年,如今的Python工匠
- MongoDB权威指南
- humanparsing自然场景人体语义分割
- 带你重读Youtube深度学习推荐系统论文,惊为神文