加速器 (Accelerator or Offload Engine) 是一块专用的硬件电路,它可实现各种功能,以便于在执行一组操作时,获得比通用微处理器更高的性能或更好的能效比。 通过软件调用加速器对各种操作加速被称为硬件加速。加速器可以显著地提升特定任务的性能。他们通常是连接到系统的一个单独的组件,但是也会被以 ISA 扩展的形式直接集成到处理器中。

一个独特的加速器子集也称为协处理器。 区别在于加速器如何与主机处理器交互。 想对于协处理器通常连接到主机处理器的内部,然后执行主机处理器传递给其的指令,而通用加速器通常被视为通过接口编程的独立 I / O设备。

加速器的使用不是一个新鲜事。浮点协处理器早在 1980 年代就已经成为加速器适配的早期例子。但是,摩尔定律所实现的更高集成度使公司可以将这些功能集成到主机处理器中,从而使它们没有了用武之地。在此后的几十年中,通用计算机通过登纳德缩放定律和摩尔定律不断提高单核性能。现代 SoC 集成了一系列的加速器,用于诸如加密和压缩之类任务的加速。

但是,到了2000年代后期,登纳德缩放定律崩溃了,单核性能的提高开始减弱。这些缺陷激发了人们对加速器的新兴趣。加速器可以像 ASIC 一样用硅实现,也可以用软硬件实现(Soft hardware is digital logic that is designed to be implemented on reconfigurable hardware such as programmable logic devices instead of being fabricated as an actual integrated circuit. Soft hardware is typically coded in a language like VHDL or Verlog and is designed to be implemented on an FPGA. )。因为这是与执行密集计算任务的算法的软件代码等效的硬件,所以几乎总是比在通用微处理器上优化的代码具有更高的性能或能效(power efficiency)。

加速器通常分为三类(可能有更多):
1.数据驱动的加速器,独立于 CPU,对一组数据进行操作的加速器。

向量加速器,用于向量执行大型向量运算的加速器

AI 加速器,在预测模型(例如人工神经网络)上运行的加速器
张量在神经网络加速器中的应用
神经网络中涉及到大量的张量运算,比如卷积,矩阵乘法,向量点乘,求和等。神经网络加速器就是针对张量运算来设计的。一个神经网络加速器通常都包含一个张量计算阵列,以及数据收发控制,共同来完成诸如矩阵乘法,卷积等计算任务。运算灵活多变的特性和硬件的固定架构产生了矛盾,这个矛盾造成了利用硬件执行计算任务的算法多变性。不同的硬件架构实现相同的计算,可能具有不同的算法。我们今天讨论基于脉动阵列的计算架构,脉动阵列的低延迟,低扇出特性使其得到广泛应用,比如TPU中。我们今天就从矩阵计算讲起,谈一谈矩阵计算的几种不同方式,矩阵的一些特性,再讲一讲CNN中的卷积运算,最后谈谈这些张量计算在硬件中的实现形式。

2 算法驱动的加速器,在专用硬件上执行特定算法的加速器

压缩加速器,使用各种算法执行压缩的加速器

加密加速器,执行各种加密操作的加速器

加密货币加速器,旨在加速加密货币交易的特殊加密加速器

图形加速器,用于处理和创建图像的加速器

DSP加速器,用于执行处理数字信号算法的加速器

3 可编程加速器,以 FPGA 形式出现的加速器,可以实现任何必要的功能。

加速器 (Accelerator or Offload Engine)相关推荐

  1. 芯片加速器 Accelerator

    加速器 (Accelerator or Offload Engine) 是一块专用的硬件电路,它可实现各种功能,以便于在执行一组操作时,获得比通用微处理器更高的性能或更好的能效比. 通过软件调用加速器 ...

  2. TOE(TCP/IP Offload Engine)网卡与一般网卡的区别

    TCP减压引擎,第一次听说这个名词,但是并不是一个新的概念了,若干年前听说过设备厂商在研究在FPGA之中实现TCP Stack,但是后来没有听到任何的产品出来,应该是路由设备to host的traff ...

  3. xnetoe toe(tcp offload engine)测试方案与结果

    本文介绍了X1702-TUALL产品TCP/UDP等功能在不同网络条件下的性能测试方法和测试结果,由于测试环境不同包括测试设备,网络状况等,可能会得到不同的测试结果,存在一定的误差范围. X1702- ...

  4. 使用xnetoe TOE(tcp offload engine)构建的网络安全隔离网关实现方案

    政府或者事业部门一般按照国家电子政务建设要求组建自己的电子政务网络,采用三级联网,政府的政务网一般主要由四部分组成: 1)内部运行信息系统的局域网(政务内网) 2)上下级互联的广域网(政务专网) 3) ...

  5. toe网卡 linux c,TOE(TCP offload Engine)在高频交易中的应用

    高频交易是指从那些普通投资者无法利用的极为短暂的市场变化中寻求获利的一种程序化交易方式,投资者为了获取这极为短暂的市场变化,需要搭建超低延时的网络系统,同时,为了最快速度的做出投资决策,需要以最快的速 ...

  6. 【转载】网络数据包分析 网卡Offload

    对于网络安全来说,网络传输数据包的捕获和分析是个基础工作,绿盟科技研究员在日常工作中,经常会捕获到一些大小远大于MTU值的数据包,经过分析这些大包的特性,发现和网卡的offload特性有关,本文对网卡 ...

  7. 网络数据包分析 网卡Offload

    对于网络安全来说,网络传输数据包的捕获和分析是个基础工作,科技研究员在日常工作中,经常会捕获到一些大小远大于MTU值的数据包,经过分析这些大包的特性,发现和网卡的offload特性有关,本文对网卡Of ...

  8. TOE(TCP/IP Offload / TCP/IP卸载)技术及产品

    TOE(TCP/IP Offload / TCP/IP卸载)技术及产品 技术原理 TOE 全称 TCP Offload Engine,是目前主要的网络加速技术,它可以显著的提高网络的数据处理能 力,降 ...

  9. 【网络】TOE、RDMA、smartNIC 是什么和区别|DPU

    目录 TOE.RDMA.smartNIC 简介 TOE(TCP/IP Offload Engine) RDMA SmartNIC 区别 TOE.RDMA.smartNIC详细说明 TOE(TCP/IP ...

最新文章

  1. 华人首位!许晨阳获2021年美国数学会代数领域最高奖
  2. 360极速浏览器安装.crx扩展(postman)
  3. 控制程序仅执行一次 php,PHP流程控制(1)
  4. Sparkmllib scala线性回归
  5. 《UNIX网络编程 卷1:套接字联网API(第3版)》——第2章 传输层:TCP、UDP和SCTP 2.1概述...
  6. Linux(CentOS6.4)下简单部署Solr4.8.1
  7. 信息学奥赛一本通(1132:石头剪子布)
  8. python plotly spyder显示_Python绘图工具Plotly的简单使用
  9. c# dynamic动态类型和匿名类
  10. [转载] python缩进报错_python缩进报错
  11. Oracle使用NLSSORT函数实现汉字的排序
  12. 原生mysql 怎么创表_Mysql的基础使用之SQL原生语句的使用:表的 创建 删除 修改 (一)...
  13. Oracle 数据库限制IP地址连接
  14. 【Datawhale】[task2]2.3代码示例
  15. 使用高德地图API实现历史轨迹查询
  16. 最新基于LBS的毕业设计题目
  17. 警惕!黑客通过iPhone充电线劫持您的计算机
  18. C++程序设计语言学习笔记:名字空间
  19. Vue文件内动态加载JS
  20. 【机器学习算法面试题】四.深度神经网络中激活函数有哪些?

热门文章

  1. Unity 支持 3ds max 2021 物理材质吗?(FBX 出口)是否应该使用BPR材质?
  2. 关于洛谷哪些题目(入门)
  3. C语言:账号登陆问题
  4. datawindow自动行高、根据行高自动调整字体大小
  5. 查询MySQL数据库中所有表的结构
  6. FAST迅捷FW150US无线网卡安装说明
  7. 产品经理可以考哪些证书提升自己?一篇文章回答你
  8. nginx 安装,配置
  9. 安装ROS时遇到的一些坑,做个笔记方便自己查看
  10. html js 打印编辑页眉,js 设置网页打印的页眉页脚和页边距