作者:刘光聪 ,中兴通讯高级系统架构师,专注机器学习算法,分布式系统架构与优化。
原文:TensorFlow架构与设计:OP本质论
责编:王艺 CSDN AI记者,投稿、寻求报道、深入交流请邮件wangyi@csdn.net或扫描文末二维码添加微信。

相关文章:

图解TensorFlow架构与设计
TensorFlow架构与设计:图模块
TensorFlow架构与设计:会话生命周期

TensorFlow的系统结构以C API为界,将整个系统分为「前端」和「后端」两个子系统。前端系统扮演了Client的角色,完成计算图的构造,通过转发Protobuf格式的GraphDef给后端系统的Master,并启动计算图的执行过程。

最终,Master将图进行分裂,通过RegisterGraph接口,将GraphDef的子图片段注册到Worker上。因此,GraphDef是描述计算图的知识模型,整个TensorFlow的计算过程都是围绕GraphDef所展开的。

领域模型

TensorFlow计算的单位是OP,它表示了某种抽象计算。本章首先阐述NodeDef, OpDef的元数据模型,然后通过一个简单的例子,讲述元数据的流动过程。


元数据


OP表示某种抽象计算,它拥有0个或多个「输入/输出」,及其0个或多个「属性」。其中,输入/输出以Tensor的形式存在。

在系统实现中,OP的元数据使用Protobuf格式的OpDef描述,实现前端与后端的数据交换,及其领域模型的统一。

OpDef定义


OpDef定义


OpDef定义包括OP的名字,输入输出列表,属性列表,优化选项等。其中,属性常常用于描述输入/输出的类型,大小,默认值,约束,及其OP的其他特性。

OpDef表示

OP命名

OP通过名字索引,因此必须保证OP的名字全局唯一。按照规范,OP的名字采用「驼峰」的命名风格,而Python前端则使用「小写下划线」的命名风格。后者也常常称为「OP构造器」,也是公开给用户的编程接口(API)。

另外,以下划线开头的OP被系统内部实现保留。例如,_Send, _Recv,它们用于设备间通信的OP;_Source, _Sink标识计算图的开始节点和结束节点。

输入/输出

OP的输入/输出以Tensor的形式存在,存在如下4种情况。

  • 0个Tensor

    • 零输入
    • 零输出
  • 1个Tensor
    • 类型确定
    • 类型不确定
  • 多个Tensor
    • 类型相同
    • 类型不相同

相对于OP的属性,OP的输入是动态的,其值每次迭代(Step)时,都会发生变化。

属性

OP可以拥有「属性集」,用于描述OP输入输出的类型,大小,默认值,约束,及其其他OP的特征。其中,计算图构造时,属性值(AttrValue)被确定(由NodeDef携带,通过GraphDef传递给后端执行系统)。

也就是说,OP的「属性定义」与「属性值设置」是两个分离的过程。其中,属性定义在OP注册时确定,通过AttrDef描述;属性值设置在计算图构造时确定(OP添加到计算图时),由AttrValue描述。

相对于OP的输入,OP的属性则是静态的。OP属性值在计算图构造期间确定,包括输入输出的类型,大小,形状等,在计算迭代过程之中不会发生变化。


NodeDef定义


NodeDef表示

OP索引

NodeDef通过op从OpRegistry中索引OpDef。

输入列表

通过input指定节点的输入列表,它也是构造计算图最重要的知识所在。它存在2种情况,分别表示普通边与控制依赖边。

按照约定,为了解析方便,input列表前面存储普通边,随后存储控制依赖边。

node:src_output

表示此边为普通边,承载Tensor的数据流。其中,node为前驱节点的名称,src_output为前驱节点输出边的索引。特殊地,当src_output为0时,可以略去0。

^node

表示该边为控制依赖边。其中,node为前驱节点的名称。

设备规范

通过device可以支持用户自定义设备分配方案。例如,

  • “@other/node”: 与other/node节点分配在同一设备;
  • “/job:worker/replica:0/task:1/gpu:3”:完整规范
  • “/job:worker/gpu:3”:部分规范
  • “”:空规范

属性值列表

在计算图的构造期,OP属性值得以确定,包括输入/输出的类型,Shape等信息。OP的属性值承载于OpDef的attr属性列表之中。


符号编程


TensorFlow的计算过程是一个延迟计算,是一种典型的基于符号的编程范式。从计算时间轴看,计算过程基本分为2个阶段:

  • 图构造期:负责计算图的构造;
  • 图执行期:负责计算图的执行。

其中,在系统初始化时,系统实现对所有OP进行扫描注册,并保存于OpRegistry之中。

注册OP

理论上,OP的注册发生在系统初始化阶段。后端系统,可以使用REGISTER_OP实用宏注册OP。前端系统,也存在类似的OP注册机制。

使用REGISTER_OP注册OP过程,实际上是一个REGISTER_OP描述到OpDef表示的翻译过程。OpDefBuilder通过链式调用Input, Output, Attr方法分别构造OP的输入、输出列表,及其属性列表。最后,通过调用Finalize成员函数,经过解析字符串表示,将其翻译为OpDef的内在表示,最后注册到OpRegistry之中。

OP构建过程

例如,REGISTER_OP(“ZerosLike”)向系统注册了一个zeros_like的OP,在运行时实现了OpDef的翻译表达。

OP注册

构造OP

在前端,用户使用OP构造器实现OP的构造,并将OP注册到计算图中。在计算图构造期间,OP的输入/输出的类型,Shape得以确定,OP属性值也得以确定。

计算图的构造过程,实际上就是GraphDef定义过程。其中,OP的属性值承载于NodeDef,计算图构造期间,NodeDef的属性值得以确定。

在计算图执行启动时,通过调用Session.run,将整个GraphDef传递给后端,并启动计算图的执行。例如,存在如下的计算图构造过程:

tensor = tf.constant([1, 2], name="n1")
zeros  = tf.zeros_like(tensor, name="n2")

ZerosLike的上游节点为n1,其src_output=0输出边流入ZerosLike。此时,ZerosLike的属性T的值自动推演为DT_INT32,两个节点构造了一个简单的计算图。

OP构造

执行OP

在计算图执行期间,输入由上游OP流入得以确定,根据特定设备类型,输入输出类型,多态选择合适的Kernel实现,并启动Kernel的计算过程。

例如,如果zeros_like上游输入为[1, 2, 3, 4],进过zeros_like的OP运算,输出为[0, 0, 0, 0]。

OP执行


TensorFlow架构与设计:OP本质论相关推荐

  1. TensorFlow是什么?TensorFlow入门与实践 架构与设计详解

    TensorFlow是什么? TensorFlow基于数据流图,用于大规模分布式数值计算的开源框架.节点表示某种抽象的计算,边表示节点之间相互联系的张量.计算图实例TensorFlow支持各种异构的平 ...

  2. InfoQ趋势报告:架构和设计领域技术演变详解

    本文概述了我们对当前"架构和设计"领域的看法,这个领域侧重于基础设施模式.技术框架模式的实现,以及软件架构师必须掌握的设计流程和技能. 关键要点: 我们看到了"演化式架构 ...

  3. 伤感网络验证系统_可验证云数据库架构与设计

    区块链的发展到了一个关键阶段.向左走,是一眼望不到尽头的公链和交易所.向右走,是一脸茫然的探寻:区块链如何和古典互联网行业相结合.就像文章<货币.区块链和社交扩展性>所阐述的根本原理,区块 ...

  4. Ubuntu tensorflow自定义GPU版本op节点

    参考:https://blog.csdn.net/qq_27637315/article/details/79114633 windows增加op节点: https://github.com/tens ...

  5. 前后端分离微服务架构如何设计?

    一.职责划分 前端 前端工作专注业务的页面呈现,非常注重用户体验度,也是与各种角色打交道最多的. 比如: 前端开发人员会经常与产品经理或者客户讨论页面样式.视觉效果,页面布局等各种页面渲染效果 前端开 ...

  6. 【研发管理】华为十大架构与设计核心原则

    正如<从偶然到必然-华为研发投资与管理实践>中提到华为提到产品是否能够呈现期望的或要求的质量属性,本质上是由架构来决定.因此,借鉴华为对于架构与设计核心原则也是很有必要.从关键理念来看跟业 ...

  7. [从架构到设计]第二回:对象的旅行---对象和人,两个世界,一样情怀(转载)...

    [从架构到设计] 第二回:对象的旅行---对象和人,两个世界,一样情怀 发布日期:2007.9.3 作者:Anytao ©2007 Anytao.com ,原创作品,转贴请注明作者和出处. 对象和人, ...

  8. Java生鲜电商平台-订单配送模块的架构与设计

    Java生鲜电商平台-订单配送模块的架构与设计 生鲜电商系统最终的目的还是用户下单支付购买, 所以订单管理系统是电商系统中最为复杂的系统,其作为中枢决定着整个商城的运转, 本文将对于生鲜类电商平台的订 ...

  9. 《大规模分布式系统架构与设计实战》

    <大规模分布式系统架构与设计实战> 基本信息 作者: 彭渊 丛书名: 大数据技术丛书 出版社:机械工业出版社 ISBN:9787111455035 上架时间:2014-2-21 出版日期: ...

最新文章

  1. linux 开机错误 Entering emergency mode. Exit the shell to continue.
  2. tensorflow l2_loss函数
  3. Talend Restful
  4. win10怎么用Linux命令,教你Windows10系统使用Linux命令的技巧
  5. @propertysource 读不到properties_在加拿大读了6年还是大学一年级,会被赶出校吗?...
  6. mysql5.7 only_full_group_by_Mysql5.7及以上版本 ONLY_FULL_GROUP_BY报错的解决方法
  7. python空列表添加_Python列表的简单操作
  8. uat测试用例怎么写_你会写测试用例吗
  9. spring cloud config-配置中心
  10. 丢失控制文件恢复实验记录--4(在线日志文件没有损坏,归档日志丢失,直接重建控制文件(跟踪控制文件trace是旧的情况))...
  11. 8、Python车牌数据集自动生成及其图片叠加
  12. Mqtt客户端与服务端通讯
  13. C语言—随机种子的设定
  14. 图书管理系统数据库设计
  15. 【白皮书】以太坊 (Ethereum ):下一代智能合约和去中心化应用平台
  16. Dynamo For Revit: List 连缀 和 Level
  17. 海康威视浅淡智能视频分析技术及产品的应用 智能视频分析技术的应用与发展
  18. matlab射频传输距离计算,VHF和UHF信号的传播距离计算工具
  19. 类unix系统中启动脚本记录
  20. eyoucms自媒体新闻资讯类网站模板

热门文章

  1. 钱小写转大写 VB
  2. 这70个Java必背英语单词不会_这70个Java必背英语单词都不会,就别当Java程序员了...
  3. 甲醛治理时应注意的细节
  4. 2023年的第一篇博客
  5. [音乐欣赏]李朝晖——体会
  6. thinkphp中使用cli模式
  7. Matlab求微分方程的符号解1
  8. android 猜歌游戏报告,Android第二十五期 - 猜歌小游戏
  9. Eureka服务续约(Renew)源码分析
  10. 数字调制系统思维导图