TVM自定义数据类型
本文将介绍“自定义数据类型”框架,该框架可在TVM中使用自定义数据类型。
介绍
在设计加速器时,关键是如何近似地表示硬件中的实数。这个问题具有长期的行业标准解决方案:IEEE 754浮点标准。然而,当试图通过构建高度专业化的设计来最大限度地利用硬件时,使用通用IEEE 754浮点数是否有意义?知道工作负载的数字要求,是否可以构建更小,更快或更省电的数据类型?答案是肯定的!研究人员已经开始在学术和工业加速器设计中尝试新的数据类型。例如,Google的Tensor处理单元(TPU)使用bfloat类型:单精度IEEE浮点数,已被截断为16位。许多深度学习工作负载的数值要求不严格,这种截断通常不会影响模型的准确性,同时会立即将存储成本降低一半。
在研究人员开始为其数据类型构建硬件之前,需要确定其数据类型在关心的工作负载中如何以数字方式表现。这通常涉及建立其数据类型的软件仿真版本(例如Berkeley SoftFloat或libposit),将数据类型直接入侵工作负载中,以查看工作负载如何使用该数据类型执行工作。更好的是将数据类型直接集成到编译器本身中,以便可以编译许多不同的工作负载以使用该数据类型。两种路由都可能很乏味,考虑到现代编译器的大小和复杂性,后一种路由通常变得难以管理。取自GitHub的一个示例显示有人入侵了将数据类型存入TensorFlow。结果是237次提交,添加了将近6000行代码,并在整个代码库中触摸了200多个文件,而这仅仅是添加一种数据类型!对于许多研究人员来说,这项工作量是令人望而却步的。
为了解决这些问题,提出了“自定义数据类型”框架。该框架允许用户将其模拟数据类型插入TVM,从而可以轻松探索深度学习工作负载中的新数据类型。与上面的posits-in-Tensorflow示例不同,该示例在编译器中启用单个新数据类型,而Bring Your Own Datatype框架则支持多种用户定义的类型。
自定义数据类型
自定义数据类型框架的目标,使用户能够使用自定义数据类型运行深度学习工作负载。在“自定义数据类型”框架中,“数据类型”表示标量类型: 例如,float 或uint。不处理更复杂的数据格式,例如块浮点数 或Intel的Flexpoint。此外,仅声称支持 这些标量数据类型的软件仿真版本;不明确支持在自定义数据类型硬件上进行编译和运行。
TVM中的每个张量都被分配了一个类型代码,该代码定义了张量内标量的数据类型。这些类型代码,在TVM中具有硬编码的含义,映射到诸如int和的常见数据类型float。但是,绝大多数类型代码尚未使用。自定义数据类型框架允许用户声明这些未使用的类型代码,并在运行时添加自己的新数据类型。
该框架被实现为一个注册表,与TVM的常规数据类型设施并排放置。用户与数据类型注册表进行交互的主要方式有两种:第一,数据类型注册, 第二,降低功能注册。
这些步骤分别类似于数据类型的声明和实现。
请注意,本文中所有引用的代码均基于TVM存储库的master分支commit 4cad71d。将使用一个示例posit数据类型,该数据类型可以src/target/datatype/posit/posit-wrapper.cc在TVM下找到,并可以在带有USE_BYODT_POSIT标志的TVM中进行编译。4
数据类型注册
要注册数据类型,用户为数据类型分配一个名称和一个类型代码,其中类型代码来自可用于自定义数据类型的未使用类型代码的范围。
tvm.target.datatype.register(‘posit’, 150)
上面的代码’posit’使用类型代码150注册数据类型。此注册步骤允许TVM解析使用自定义类型的程序:
x = relay.var(‘x’, shape=(3, ), dtype=‘float32’)
y = relay.var(‘y’, shape=(3, ), dtype=‘float32’)
x_posit = relay.cast(x, dtype=‘custom[posit]16’)
y_posit = relay.cast(y, dtype=‘custom[posit]16’)
z_posit = x_posit + y_posit
z = relay.cast(z_posit, dtype=‘float32’)
program = relay.Function([x, y], z)
print(program)

v0.0.4

fn (%x: Tensor[(3), float32], %y: Tensor[(3), float32]) {

%0 = cast(%x, dtype=“custom[posit]16”);

%1 = cast(%y, dtype=“custom[posit]16”);

%2 = add(%0, %1);

cast(%2, dtype=“float32”)

}

上述管型的程序float32的输入x和y 到positS,将相加,并注塑结果回float32。一旦posit注册了类型,TVM便可以解析特殊dtype语法 custom[],其中是为该类型注册的名称。此语法还支持通常的 x格式。在这里,16用来表示每个posit都是16位宽。(车道数默认为1。)
降低功能注册
尽管TVM可以解析上述程序,但它尚不能编译,TVM尚不了解如何在该posit类型上编译操作。为了编译这些程序,为自定义数据类型注册了降级函数,这有助于TVM将操作转换为它可以理解和编译的内容。
通常,不希望用户直接将操作降低到LLVM或CUDA。相反,可以通过一些简单的技巧,将大多数使用自定义数据类型的代码,简化为不使用自定义数据类型的代码。可以依靠本机TVM来理解和编译代码。

图1:用户注册的降低功能的预期结果。降低功能应将使用自定义数据类型的程序转换为本机TVM可以理解和编译的程序(在这种情况下,需要使用两个uint16_t来调用外部库)。
图1显示了一种常见模式。假设有兴趣探索这种posit类型,并选择通过“自定义数据类型”框架将posit仿真库(例如Stillwater Universal)插入TVM中来运行某些工作负载。工作量是一个简单的程序,其中添加了两个posit输入。本机TVM不了解如何实现posit加法-但有一个实现数据类型的库,所以不是必需的!该库包含posit加法的实现以及其它运算符,例如乘法和平方根。要实现此posit添加,只想调用库。因此,Add节点应成为Call节点,并调出一个函数(调用它Posit16es2Add)在库中。为了将输入posit的位存储在TVM可以理解的类型内,使用16位无符号整数。生成的程序是TVM可以理解和编译的程序,它是对外部库函数的调用,使用两个无符号整数。
为了实现上述降低,为以下对象注册了降低功能posit:
tvm.target.datatype.register_op(
tvm.target.datatype.create_lower_func({16: ‘Posit16es2Add’}),
‘Add’, ‘llvm’, ‘posit’)
上面的代码为特定的运算符(Add),编译目标(LLVM),数据类型(posit)和位长(16)注册了一个降低函数。第一个参数是降低功能。这可以是采用TVM IR节点并返回新的TVM IR节点的任何功能。在案例中,使用Bring Your Own Datatypes框架提供的帮助程序功能。 tvm.target.datatype.create_lower_func({16:‘Posit16es2Add’}) 为上述通用模式创建降低功能。结果函数将给定节点的参数转换为uint16_t,将节点本身转换为对给定函数名称的调用(在这种情况下,位长度’Posit16es2Add’为posits)。将一个字典传递给create_lower_func,以便TVM可以根据数据类型的位长,将其分配给适当的函数名称。
为了实现自定义数据类型,用户将需要为想要运行的工作负载中的每个算子注册一个降低功能。对于像ResNet这样的网络,将大约有10个算子,包括Add,Div,各种Cast和Max。在测试中,注册数据类型和所有降低功能需要大约40行Python。一旦注册了所有需要的算子,就可以像其它任何TVM程序一样,轻松地运行自定义数据类型的工作负载!
包起来wrapping up
自定义数据类型框架将用户定义的数据类型引入TVM。鼓励数据类型研究人员在研究中使用TVM;同样,引起深度学习社区中对自定义数据类型的兴趣。有关“携带自己的数据类型”框架的更多文档。

TVM自定义数据类型相关推荐

  1. 自主数据类型:在TVM中启用自定义数据类型探索

    自主数据类型:在TVM中启用自定义数据类型探索 介绍 在设计加速器时,一个重要的决定是如何在硬件中近似地表示实数.这个问题有一个长期的行业标准解决方案:IEEE 754浮点标准.1.然而,当试图通过构 ...

  2. hadoop map reduce自定义数据类型时注意顺序,否则报错。

    2019独角兽企业重金招聘Python工程师标准>>> 自定义数据类型,实现Writable接口,重写write方法和readFields方法时,在操作字段时,必须保证顺序,如果在w ...

  3. Qt信号与槽传递自定义数据类型——两种解决方法

    Qt信号与槽传递自定义数据类型--两种解决方法 参考文章: (1)Qt信号与槽传递自定义数据类型--两种解决方法 (2)https://www.cnblogs.com/tid-think/p/9300 ...

  4. 【剑仙教程】易语言的结构体。自定义数据类型。

    1楼. [剑仙教程]易语言的结构体.自定义数据类型. 在易语言中,有基本数据类型,自定义数据类型. 自定义数据类型,在C语言/C++中称为结构体.这是面向对象和类的编程. . . 先上代码.打开易语言 ...

  5. Oracle自定义数据类型 1

    原文 oracle 自定义类型 type / create type 一 Oracle中的类型 类型有很多种,主要可以分为以下几类: 1.字符串类型.如:char.nchar.varchar2.nva ...

  6. 玩转C语言之自定义数据类型-typedef

    玩转C语言之自定义数据类型-typedef 1 引言 引言:在C语言中没有提供字节类型,如果在工程中需要使用表示字节的变量时,该怎么办呢? 我们知道 1 个字节占用 8 个二进制位空间,解决这个问题的 ...

  7. go函数详解:函数定义、形参、返回值定义规范、函数内存分析、不支持重载、支持可变参数、基本数据类型和数组默认都是值传递的、支持自定义数据类型、函数返回值命名

    引入 [1]为什么要使用函数: 提高代码的复用型,减少代码的冗余,代码的维护性也提高了 [2]函数的定义: 为完成某一功能的程序指令(语句)的集合,称为函数. [3]基本语法 func 函数名(形参列 ...

  8. Go支持自定义数据类型:使用type来定义,类似于数据类型的一个别名

    为了简化数据类型定义,Go支持自定义数据类型 基本语法: type 自定义数据类型名 数据类型 可以理解为 : 相当于起了一个别名 例如:type mylnt int ----->这时mylnt ...

  9. Android AIDL使用介绍(2)自定义数据类型的传递

    1.背景 默认情况下,AIDL只支持下列数据类型: Java八种基础数据类型(如 int.long.char.boolean 等); String字符串: CharSequence字符序列: List ...

最新文章

  1. 近期活动盘点:三创对接会——先进制造专场
  2. 修改MD5加密 提高网站安全
  3. 基于OpenCV平滑图像
  4. java提供密码加密的实现
  5. [数据库事务与锁]详解一: 彻底理解数据库事务
  6. Jmeter笔记(5)线程组执行顺序
  7. iphone闪退修复工具_iOS 13.3越yu工具再更新,修复若干问题(附自签教程)
  8. 微信小程序业务-字符串生成二维码(weapp-qrcode)
  9. java运行环境变量及自定义变量
  10. 要Java显示script文字_Javasrcipt---HTML中使用Javascript
  11. 微信小程序不支持打开非业务域名_开达应用五端合一:抖音/头条小程序基础配置...
  12. Sqlite中的字符串连接
  13. SpringBoot-JPA删除不成功,只执行了查询语句
  14. 基于深度学习的SLAM综述:迈向空间机器智能时代
  15. excel如何去重统计户数_Excel如何去重,然后统计数据?_excel提取数据并去重
  16. 计算机类的本科学校有哪些专业考研,计算机专业考研学校推荐有哪些
  17. html转换成chm乱码,【全部解决】用Docbook生成htmlhelp + 【完全解决】生成的chm中标题和左边的索引目录是乱码的问题...
  18. Unity3D 法线转换切线空间
  19. 微信公众号12大互动技巧
  20. QT实现简单的上位机软件

热门文章

  1. 基于Golang的监听读取配置文件的程序包开发——simpleConfig_v1
  2. 2022-2028年中国炼钢行业市场研究及前瞻分析报告
  3. Python+OpenCV 图像处理系列(9)—— 图像的翻转和缩放插值
  4. Vue 自定义权限指令
  5. 学习原来可以如此简单
  6. python中的next()以及iter()函数
  7. CodeGen准备存储库
  8. Python分析离散心率信号(上)
  9. 推荐系统的个性化排名
  10. Activity在有Dialog时按Home键的生命周期