一、Tegra发展以及各Tegra对比

1、Tegra发展

(1)2008年2月,NVIDIA与Microsoft合作开发基于ARM11架构的APX 2500应用处理器发布。

(2)随后英伟达发布Tegra产品Tegra 600 和 Tegra 650,集成的显示核心是基于GeForce 6,并加入了对CUDA和双精度浮点运算的支持。

2、Tegra发展图谱

3、各Tegra简要对比

二、Tegra X1/X2 架构解析

1、Tegra X1架构解析

(1)NVIDIA GeForce Maxwell 图形处理单元(GPU);

(2)四核 ARM Cortex-A57 核心;

(3)64位DRAM接口提供了高宽带;

(4)基于一个Cortex-A9处理器和独立RAM的独立音频子系统;

(5)双显示控制器;

(6)高性能H.265/H.264视频硬件编码器,以及编码器完全支持超高清的10位像素4K视频60fps。

2、Maxwell架构解析

(1)相对Kepler而言,Maxwell重构了新的SMM以提高效率,全新的数据通路管理与组织;

(2)每个SMM包含4个Warp Schedulers;

(3)每个Warp Scheduler可以在每个Warp周期发起两条指令;

(4)Maxwell的CUDA Core是Kepler性能的1.4倍;

(5)2 SMM * 4 Warp Scheduler * 32 CUDA Core Processing Blocks = 256 CUDA Core

3、CUDA Core

4、Kepler VS Maxwell

5、GTX 980 VS TX1

6、Tegra X2架构解析

(1)NVIDIA Pascal 图形处理单元(GPU)架构;

(2)双核NVIDIA Denver 2 ARM CPU 核心,加四核ARM Cortex-A57核心;

(3)基于一个Cortex-A9处理器和独立RAM的独立音频子系统;

(4)基于独立的ARM Cortex-R5F 传感器处理器;

(5)基于独立的ARM Cortex-R5F 处理器子系统用于处理启动和能量管理;

(6)基于独立的ARM Cortex-R5F 处理器子系统用于处理摄像头管理;

(7)128位DRAM接口提供了高宽带的LPDDR4支持。

7、Pascal 架构解析

(1)相对于Kepler,Pascal简化了数据通路组织与管理,降低了Die区域大小,降低了数据传输时的能量消耗;

(2)新的SM调度器架构基于Maxwell调度器,且更加的智能化,即提高了性能有降低了功耗;

(3)一个SM内有2个Warp Scheduler,每个Warp Scheduler 可以在每个Warp周期发起两条指令;

(4)一个Warp Scheduler内有32个单精度CUDA Core。

8、Pascal VS Maxwell

9、Jetson TX1 VS Jetson TX2

10、TX1处理器性能

11、TX1图形性能

三、ARM Cortex-A57架构解析

1、ARM处理器家族

2、ARM Cortex-A57架构解析

(1)完全遵循 ARMv8-A 指令集规范;

(2)超标量,可变长度,乱序执行流水线;

(3)带有分支目标缓冲(BTB)与全局历史缓冲(GHB)RAM,一个返回堆栈,以及一个间接预测器的动态分支预测;

(4)AMBA 4 AXI 一致性扩展(ACE)或CHI 主机接口;

(5)实现了加速器一致性端口(ACP)为AXI4一致性从机接口;

(6)支持基于ETMv4架构的嵌入式跟踪单元(ETM);

(7)支持基于PMUv3架构的性能监控单元(PMU);

(8)用于多处理器调试的交叉触发接口(CTI);

(9)通用中断控制器(GIC)CPU接口。

3、ARM Cortex-A57的性能

4、AArch32 VS AArch64

5、NEON架构解析

(1)架构分析

(2)NEON数据读取模式

(3)NEON架构对比

四、Tegra工作原理与软件架构

1、Tegra 工作原理

2、Tegra中断控制

(1)一共有0-192号全局中断,由六个中断控制器分别管理;

(2)TX1中断控制器分为两类:GIC400与LIC;

(3)GIC400是ARM Cortex-A57 的中断控制器;

(4)LIC是属于轻量级BPMP处理器的中断控制器;

(5)任何处理器都可以发送一个软件中断给其它一个或多个处理器(包括自身),但是IPI中断志限于A57之间(包括自身);

(6)每个ARM处理器都有两个引脚来接收IRQ和FIQ中断,因为低电平触发,因此命名nFIQ和nIRQ;

3、Component 软件结构

(1)OS Images:JetPack包含来自Ubuntu的样例文件系统;

(2)Libraries:CUDA Toolkit(Linux下CUDA开发工具链)、TensorRT and cuDNN(高性能深度学习应用)、VisionWorks and Opencv(视觉计算应用);

(3)Developer Tools:Tegra Graphics Debugger(调试OpenGL控制台级别地 工程)、Tegra System Profiler(系统调试跟踪分析器,提高CPU效率)、PerfKit(提供访问GPU性能统计)、Samples(NVIDIA GameWorks Vulkan 以及 OpenGL 范例)。

4、VisionWorks 软件结构

五、Jetson 开发注意事项

1、Jetson 功能概览

2、Jetson功能布局

3、Jetson注意事项

(1)0-50℃温度范围内工作;

(2)不同用户的eMMC、DRAM厂商型号可能不同;

(3)SATA不支持热插拔;

(4)除了IIC_GPI是3.3V以外,其它的IIC接口都是1.8V接口;

(5)TX1生命期(EOL)至2021年1月(商业级);

(6)Jetson TX1只有四核A57,没有A53;

(7)上电后风扇不转,自动风扇调速;

(8)默认没安装系统,新的模块上电后无任何反应。

4、CUDA开发注意事项

5、Jetson 开发注意事项

致谢

1、《Jetson开发者入门之Tegra架构解析》

2、NVIDIA-Jetson_github

TX2--Tegra架构介绍相关推荐

  1. NVIDIA显卡及架构介绍

    [版权申明]未经博主同意,谢绝转载!(请尊重原创,博主保留追究权): 本博客的内容来自于:NVIDIA显卡及架构介绍: 学习.合作与交流联系q384660495: 本博客的内容仅供学习与参考,并非营利 ...

  2. MindSpore Lite整体架构介绍

    MindSpore Lite整体架构介绍 MindSpore Lite框架的总体架构如下所示: • 前端(Frontend): 负责模型生成,用户可以通过模型构建接口构建模型,将第三方模型和MindS ...

  3. MindSpore整体架构介绍

    MindSpore整体架构介绍 MindSpore框架架构总体分为MindSpore前端表示层.MindSpore计算图引擎和MindSpore后端运行时三层. • MindSpore前端表示层(Mi ...

  4. 微服务架构介绍和RPC框架对比

    微服务架构介绍和RPC框架对比 1.微服务架构 1.1 特征 自动化部署,端点智能化,语言和数据的去中心化控制. 1.2架构 一种将一个单一应用程序开发为一组小型服务的方法,每个服务运行在自己的进程中 ...

  5. 伍哥原创之豆荚商城商品搜索架构介绍

    为什么80%的码农都做不了架构师?>>>    豆荚商城(www.dou55.com)商品搜索架构介绍 1,需求分析 伍哥所在的豆荚商城是一个家电行业的B2C网上零售平台.作为这样一 ...

  6. 12.1 LNMP架构介绍;12.2 MySQL安装;12.3-2.4 PHP安装(上下);12.5

    扩展: Nginx为什么比Apache Httpd高效:原理篇 http://www.toxingwang.com/linux-unix/linux-basic/1712.html apache和ng ...

  7. Kafka系列一之架构介绍和安装

    Kafka架构介绍和安装 写在前面 还是那句话,当你学习一个新的东西之前,你总得知道这个东西是什么?这个东西可以用来做什么?然后你才会去学习它,使用它.简单来说,kafka既是一个消息队列,如今,它也 ...

  8. LAMP架构介绍、MySQL和MariaDB介绍、MySQL安装

    2019独角兽企业重金招聘Python工程师标准>>> LAMP架构介绍 Linux+Apache+MySQL+PHP 就是在linux系统上安装httpd. mysql .PHP, ...

  9. 互联网直播云计算架构介绍

    互联网直播云计算架构介绍 原文:互联网直播云计算架构介绍 思想 拆分 URL分层 模块化 云服务结构 ECS 云计算的优势 -------------------------------------- ...

  10. LNMP基础架构介绍与安装

    1.LNMP架构介绍 LNMP==Linux+Nginx+Mysql+PHP  nginx:省资源,省cpu,所以在高并发时能够处理更多的请求,高端能达到3万到5万的并发量.  nginx和LAMP不 ...

最新文章

  1. Linux 下 进程运行时内部函数耗时的统计 工具:pstack,strace,perf trace,systemtap
  2. Java项目:前台预定+后台管理酒店管理系统(java+SSM+jsp+mysql+maven)
  3. swift - label 的font 设置 文字字体和大小
  4. 2021年春季学期-信号与系统-第九次作业参考答案-第六小题
  5. 【python初识】数据和对象
  6. 抽奖的箱子_王者荣耀近期问题不断,昭君星元箱子开出空气,瑶新皮涉嫌抄袭...
  7. 【算法】单源最短路径和任意两点最短路径总结(补增:SPFA)
  8. Docker服务器的图形显示方案
  9. bootstrap的栅格系统和响应式工具
  10. java disposable_rx-java – RxJava中的CompositeDisposable是什么
  11. 总结1-深度学习-基础知识学习
  12. 46张PPT彻底弄懂JVM、GC算法和性能调优!
  13. 两台redhat7虚拟机配置ssh免密访问
  14. python 编写一个银行卡类,具有账号,人名与余额属性。编写提款机类,接收一张银行卡,并且具有存款,提款,查询余额,转账功能
  15. SE96X、CM500-I27条码扫描引擎使用经验
  16. html5 树开花效果,院子里别养花了,种上这5种“开花树”,比盆栽漂亮多1倍
  17. 根据微信公众号关注/取消关注事件,获取用户信息
  18. VRP远程管理(华为设备telnet登录密码配置与测试环境搭建)——在物理机上创建回环网卡及eNSP模拟器与物理机实现连接通信
  19. Java数组初始化, 冒泡排序, 查找
  20. # JAVA实现评论功能设计开发

热门文章

  1. idea 查看方法在哪被调用快捷键_IntelliJ IDEA最常用快捷键快速查看手册-工欲善其事,必先利其器...
  2. Oracle 对表空间无操作权限
  3. 高数 | 精通中值定理 解题套路汇总
  4. 计算机中文字转换为表格怎么弄,怎样将wps中的文字转化成表格?
  5. 什么是搜索引擎关键词?搜索引擎关键词优化
  6. 爱国者u盘linux驱动,爱国者u盘驱动
  7. flask上传图片解决方案
  8. sklearn之线性回归实现—阿里云天池二手车交易价格预测赛
  9. 中学生怎样才能合理使用计算机,浅析中学生计算机的使用
  10. golang使用gomonkey和monkey来mock方法或者函数时报panic: permission denied [recovered]