Tensorrt一些优化技术介绍


Figure 1. A quantizable AveragePool layer (in blue) is fused with a DQ layer and a Q layer. All three layers are replaced by a quantized AveragePool layer (in green).

Figure 2. An illustration depicting a DQ forward-propagation and Q backward-propagation.

Figure 3. Two examples of how TensorRT fuses convolutional layers. On the left, only the inputs are quantized. On the right, both inputs and output are quantized.

Figure 4. Example of a linear operation followed by an activation function.

Figure 5. Batch normalization is fused with convolution and ReLU while keeping the same execution order as defined in the pre-fusion network. There is no need to simulate BN-folding in the training network.

Figure 6. The precision of xf1 is floating-point, so the output of the fused convolution is limited to floating-point, and the trailing Q-layer cannot be fused with the convolution.

Figure 7. When xf1 is quantized to INT8, the output of the fused convolution is also INT8, and the trailing Q-layer is fused with the convolution.

Figure 8. An example of quantizing a quantizable-operator. An element-wise addition operator is fused with the input DQ operators and the output Q operator.

Figure 9. An example of suboptimal quantization fusions: contrast the suboptimal fusion in A and the optimal fusion in B. The extra pair of Q/DQ operators (highlighted with a glowing-green border) forces the separation of the convolution operator from the element-wise addition operator.

Figure 10. An example showing scales of Q1 and Q2 are compared for equality, and if equal, they are allowed to propagate backward. If the engine is refitted with new values for Q1 and Q2 such that Q1 != Q2, then an exception aborts the refitting process.

参考链接:
https://docs.nvidia.com/deeplearning/tensorrt/developer-guide/index.html

Tensorrt一些优化技术介绍相关推荐

  1. 黑盒优化技术评测基准RABBO介绍

    引言 在面对一些极其复杂的.目标函数不可解析的优化问题时,我们经常如坠入茫茫黑夜.不知道路在何方,黑盒优化技术正是冲破这茫茫黑夜,将我们带向最优解的一项技术. 作为优化领域的一个分支,黑盒优化所针对的 ...

  2. 大前端CPU优化技术--NEON指令介绍

    前言 ARM NEON 可以提升音视频,图像,计算机视觉等计算密集型程序的性能,在上一篇大前端CPU优化技术--NEON技术的介绍中,我们知道一些编译器可以将 C/C++ 代码自动转换为 NEON 指 ...

  3. 海量智库第4期|Vastbase G100核心技术介绍之【NUMA架构性能优化技术】

    导语 NUMA架构优化技术是针对程序在NUMA架构CPU上运行出现资源消耗不均,程序执行效率低等问题进行优化的技术.这种优化技术在现在主流的NUMA架构多核服务器中,可以有效降低访问时延,提升高并发场 ...

  4. 深度学习自动编译和优化技术调研

    深度学习自动编译和优化技术调研 转自:https://moqi.com.cn/blog/deeplearning/ 作者:墨奇科技全栈开发 在墨奇科技,我们需要将一些包含深度神经网络(DNN)的 AI ...

  5. WMI技术介绍和应用——查询系统信息和补丁包信息

    本文使用了< WMI技术介绍和应用--使用VC编写一个半同步查询WMI服务的类>中代码做为基础.本节只是列出了WQL语句,具体使用参看前面的例子.( 转载请指明出于breaksoftwar ...

  6. 干货丨从基础知识到实际应用,一文了解「机器学习非凸优化技术」

    文章来源:机器之心 优化作为一种研究领域在科技中有很多应用.随着数字计算机的发展和算力的大幅增长,优化对生活的影响也越来越大.今天,小到航班表大到医疗.物理.人工智能的发展,都依赖优化技术的进步. 在 ...

  7. DPDK — 数据平台优化技术

    目录 文章目录 目录 DPDK 优化技术 DPDK 性能影响因素 硬件结构的影响 OS 版本及其内核的影响 OVS 性能问题 内存管理 CPU 核间无锁通信 设置正确的目标 CPU 类型与模式 优化方 ...

  8. 内核网络中的GRO、RFS、RPS技术介绍和调优

    内核网络中的GRO.RFS.RPS技术介绍和调优 1. 前言 2. GRO(Generic Receive Offloading) 2.1 使用 ethtool 修改 GRO 配置 2.2 napi_ ...

  9. 网易视频云分享:流媒体技术介绍(上篇)

    网易视频云分享:流媒体技术介绍(上篇) 网易视频云2016-04-14 11:49:49 创业 媒体 技术 阅读(949)评论(0) 声明:本文由入驻搜狐公众平台的作者撰写,除搜狐官方账号外,观点仅代 ...

最新文章

  1. Bitmap 多语言实现及应用
  2. Linux系统简单介绍和基本命令
  3. easy ui 使用总结
  4. SparkStreaming简介 - 与第一个Spark实时计算程序,使用netcat来写数据 - wordcount
  5. 数据结构之图的存储结构:十字链表法
  6. 小红书去水印代码_小红书商家须知!小红书引流靠谱吗?
  7. 根据用户名或者厂商名称生成相关的弱口令
  8. JavaScript:Functions
  9. 百度盘搜失效?这款网盘搜索神器万万别错过!
  10. Sublime Text 3 破解版 + 注册机 + 汉化包 + 教程
  11. 老人机java游戏模拟器_Java模拟器
  12. 激活Windows10,激活软件被报出,软件存在威胁或者恶意程序?
  13. iis发布网站无法连接服务器,IIS网站部署常见问题处理
  14. 保利威视教程:什么是HLS?
  15. python12306抢票_Python3.6实现12306火车票自动抢票,并短信和邮件通知
  16. iPhoneX利用unc0ver来越狱iOS12
  17. Mediapipe 基于KNIFT图标识别demo
  18. 一种求不规则三棱柱(三条棱垂直于底面)体积的猜想
  19. 【服装供应链】出产端供应链推翻创新意义
  20. 文字开头隐藏css,浅析CSS隐藏页面文字的几种方式总结

热门文章

  1. 2022-2028年中国环卫行业产业链深度调研及投资前景预测报告
  2. 2022-2028年中国pu管行业市场深度分析及市场规模预测报告
  3. Go 学习笔记(58)— Go 第三方库之 etcd/clientv3(连接客户端、PUT、GET、Lease、Op、Txn、Watch 基础概念说明)
  4. 一篇文章告诉你标准化和归一化的区别?
  5. pycharm连接远程服务器并进行代码上传+远程调试
  6. OpenCL™(开放计算语言)概述
  7. PyTorch 自动微分示例
  8. GPU上的图像和信号处理
  9. Linux架构思维导图
  10. 2021年大数据Hadoop(一):​​​​​​​Hadoop介绍