FLOPS是Floating-point Operations Per Second的缩写,代表每秒所执行的浮点运算次数。现在衡量计算能力的标准是TFLOPS(每秒万亿次浮点运算)

NVIDIA显卡算力表:https://developer.nvidia.com/cuda-gpus#compute

例如: 以GTX680为例, 单核一个时钟周期单精度计算次数为两次,处理核个数 为1536, 主频为1006MHZ,那他的计算能力的峰值P 为:P = 2 × 1536 × 1006MHZ = 3.09TFLOPS,1T为1兆,也就是说,GTX680每秒可以进行超过3兆次的单精度运算。

各种FLOPS的含义
MFLOPS (megaFLOPS):每秒一百万 (=10^6) 次的浮点运算

GFLOPS (gigaFLOPS) :每秒十亿 (=10^9) 次的浮点运算

TFLOPS (teraFLOPS) :每秒一万亿 (=10^12) 次的浮点运算

PFLOPS (petaFLOPS) :每秒一千万亿 (=10^15) 次的浮点运算

补充:
算力单位

TOPS(Tera Operations Per Second):1TOPS代表处理器每秒钟可进行一万亿次(10^12)操作。

GOPS(Giga Operations Per Second):1GOPS代表处理器每秒钟可进行一亿次(10^9)操作。

MOPS(Million Operation Per Second):1MOPS代表处理器每秒钟可进行一百万次(10^6)操作。

在某些情况下,还使用 TOPS/W 来作为评价处理器运算能力的一个性能指标,TOPS/W 用于度量在1W功耗的情况下,处理器能进行多少万亿次操作。

2、LPDDR RAM是“低功耗双倍数据速率内存”的缩写,与桌面平台的DDR4内存相比,面向移动平台的LPDDR4,其能够在带来等效的性能(速度)的同时,兼顾更少的能源消耗。

说到节能,最简单的就是降低运行电压了。LPDDR3的电压为1.2V,但是LPDDR4已经进一步降低到了1.1V。此外,新标准还改进了低频节能模式,因此设备可以在执行简单的后台任务的同时,将始终速度降下来,以便进一步节能电能。

[图]关于LPDDR4内存:你需要知道的几件事 - 硬件 - cnBeta.COM

3、eMMC就是一个存储芯片,就像SD卡一样,用于存取数据。从普通开发者角度看,只要遵循eMMC协议,就可以对eMMC芯片进行读写操作。(拓展:SD卡、UFS芯片、eMMC芯片、U盘都是类似的功能,从使用角度看,只是接口不同、通信协议不同,本教程只涉及目前最新的eMMC芯片,遵循eMMC5.1协议。)eMMC ,即:Embedded Multi Media Card 的缩写。由一个嵌入式存储解决方案组成,带有MMC接口、快闪存储器设备及主控制器。所有都在一个小型的BGA 封装。接口速度最高可达每秒400MBytes,其接口电压可以是1.8V或者是3.3V。

eMMC ,即:Embedded Multi Media Card 的缩写。由一个嵌入式存储解决方案组成,带有MMC接口、快闪存储器设备及主控制器。所有都在一个小型的BGA 封装。接口速度最高可达每秒400MBytes,其接口电压可以是1.8V或者是3.3V。

eMMC5.1入门教程【1】eMMC简介与协议概览_mm13420109325的博客-CSDN博客

4、高效视频编码(HEVC),也称为H.265,可以通过蓝光最佳视频压缩方法实现两倍的压缩。

5、CUDA(Compute Unified Device Architecture),是显卡厂商NVIDIA推出的运算平台。 CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。 它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。 开发人员可以使用C语言来为CUDA™架构编写程序,C语言是应用最广泛的一种高级编程语言。所编写出的程序可以在支持CUDA™的处理器上以超高性能运行。CUDA3.0已经开始支持C++和FORTRAN。

​​​​​​CUDA_百度百科

6、

什么是TensorRT
一般的深度学习项目,训练时为了加快速度,会使用多 GPU 分布式训练。但在部署推理时,为了降低成本,往往使用单个 GPU 机器甚至嵌入式平台(比如 NVIDIA Jetson)进行部署,部署端也要有与训练时相同的深度学习环境,如 caffe,TensorFlow 等。由于训练的网络模型可能会很大(比如,inception,resnet 等),参数很多,而且部署端的机器性能存在差异,就会导致推理速度慢,延迟高。这对于那些高实时性的应用场合是致命的,比如自动驾驶要求实时目标检测,目标追踪等。所以为了提高部署推理的速度,出现了很多轻量级神经网络,比如 squeezenet,mobilenet,shufflenet 等。基本做法都是基于现有的经典模型提出一种新的模型结构,然后用这些改造过的模型重新训练,再重新部署。

而 TensorRT 则是对训练好的模型进行优化。 TensorRT 就只是推理优化器。当你的网络训练完之后,可以将训练模型文件直接丢进 TensorRT中,而不再需要依赖深度学习框架(Caffe,TensorFlow 等),如下:

可以认为 TensorRT 是一个只有前向传播的深度学习框架,这个框架可以将  Caffe,TensorFlow 的网络模型解析,然后与 TensorRT 中对应的层进行一一映射,把其他框架的模型统一全部转换到 TensorRT 中,然后在 TensorRT 中可以针对 NVIDIA 自家 GPU 实施优化策略,并进行部署加速。

Jetson Nano 人工智能计算相关推荐

  1. 【持续更新】Jetson Nano 人工智能机器人开发实战案例——RosmasterX3A1

    1.Jetson简介 Jetson Nano是Nvidia在Jetson XAVIER NX/TX2 NX获得成功后于2019年3月上市的低配版GPU运算平台. 图 1-1 1.1参数 官方公布参数 ...

  2. jetson nano开电源_微雪电子NVIDIA Jetson Nano人工智能开发套件AI板介绍

    英伟达JetsonNanoDeveloperKit摄像头 7寸触摸屏.IMA219摄像头.64G内存卡.电源等,到手即用. 型号JetsonNanoDeveloperKit 产品简介[自我介绍] 我是 ...

  3. 基于PP-ShiTu的零售商品结算系统设计与在Jetson Nano上部署推理使用

    文章目录 第一章 作品概述 1.1 团队介绍 1.2 背景 1.3 简介 1.4 创新点与问题 1.5 发展前景 1.6 技术路线 第2章 技术方案 2.1 主体检测 2.2 特征提取 2.3 向量检 ...

  4. linux的系统监视器图片_用Nvidia Jetson Nano 2GB和Python构建一个价值60美元的人脸识别系统 - 人工智能遇见磐创...

    作者|Adam Geitgey 编译|Flin 来源|medium 新的Nvidia Jetson Nano 2GB开发板(今天宣布!)是一款单板机,售价59美元,运行带有GPU加速的人工智能软件. ...

  5. AI人工智能 > Nvidia英伟达 > Jetson Nano模组尺寸

    最近在设计机器人小车底盘,需要搜集主流人工智能控制板的尺寸,找了好久没有找到Jetson Nano板子的,只有通过去3D网站下载现成的3D模型,然后在转换成dxf导出尺寸,下面是我设计的小车底盘,还只 ...

  6. Jetson Nano 从入门到实战(转载)(案例:Opencv配置、人脸检测、二维码检测)

    目录 1. Jetson Nano简介 2. Jetson Nano环境配置 2.1 开箱配件介绍 2.2 烧录系统 2.3 开机和基本设置 2.4 开发环境配置 2.4.1 更新源和软件 2.4.2 ...

  7. Jetson Nano 从入门到实战(案例:Opencv配置、人脸检测、二维码检测)

    目录 1. Jetson Nano简介 2. Jetson Nano环境配置 2.1 开箱配件介绍 2.2 烧录系统 2.3 开机和基本设置 2.4 开发环境配置 2.4.1 更新源和软件 2.4.2 ...

  8. jetson nano开发使用的基础详细分享

    前言: 最近拿到一块jetson nano 2GB版本的板子,折腾了一下,从烧录镜像.修改配件等,准备一篇开箱基础文章给大家介绍一下这块AI开发板. 作者:良知犹存 转载授权以及围观:欢迎关注微信公众 ...

  9. 英伟达 Nano 新手必读:Jetson Nano 深度学习算法模型基准性能测评

    NVIDIA在2019年NVIDIA GPU技术会议(GTC)上宣布了Jetson纳米开发工具包,这是一款99美元的计算机,目前可供嵌入式设计师.研究人员和DIY制造商使用,在一个紧凑.易用的平台上, ...

最新文章

  1. Django,Ajax,文件上传,ajax发送json数据,基于Ajax的文件上传
  2. 软件开发中的一些感想
  3. java 上传源码_和付费网盘说再见,跟着本文自己起个网盘(Java)
  4. 12-mysql-sql99语法-内连接,左右连接查询
  5. ONVIFclient搜索设备获取rtsp地址开发笔记(精华篇)
  6. 2016.01.10 论文扩充、精修、查重
  7. iframe 滚动条不显示_BUG赏金 | 当我发现iFrame注入时的利用
  8. scala 偏函数及其用途
  9. 信号与系统_严国志_第一章_绪论
  10. H5唤醒Android App
  11. unity3D游戏素材素材哪家强?Top3都在这!
  12. 基于单片机步进电机控制器设计(正转反转指示灯挡位)
  13. NVR和DVR有什么区别
  14. SpringBoot YML 配置ListBean
  15. 测试换发型用啥软件,什么软件可以测试自己适合的发型
  16. LeetCode347. 前 K 个高频元素(含详细解析JAVA实现)
  17. 美团2021校招笔试-编程题题解
  18. 【生信分析】生物分子网络构建基础——酶动力学
  19. c++类与对象(一)
  20. win7正版微软给你

热门文章

  1. netterm连接linux虚拟机(转)
  2. Zero-shot Learning / One-shot Learning
  3. GSM系统信令接续流程
  4. js提取数组对象中的最大值和最小值
  5. openoffice安装及使用,linux文件资源下载及windows资源下载
  6. 7个你绝对没用过的超强搜索引擎
  7. 教你一招搞定 GitHub 下载加速!
  8. PSD文件误删了怎么恢复?教你三招
  9. iQOO Z6和iQOOZ6x的区别 选哪个好
  10. 单点登录SSO:图示和讲解