Pentium 4 Intel® NetBurst™ Micro-architecture Details

Pentium 4处理器是Intel全新NetBurst微架构 的第一代处理器实现(其实也是最后一代)。本节详细介绍NetBurst微架构以及它在Pentium 4处理器上的运行细节。这些信息为后续章节中推荐的优化原则与编码规则提供了技术背景知识。

Intel NetBurst微架构的设计目标是高主频高性能的整型和浮点型计算,具有如下特性:

  • 超深度流水线技术,允许高主频以及远超过1GHZ的升频潜力
  • 急速执行引擎,减少基本的整型指令的延迟
  • 高性能的4泵的总线接口,高达400MHz的系统总线频率
  • 乱序地投机式执行,允许指令并行执行
  • 超标量发射指令,运行并行性
  • 硬件寄存器重命名机制,避免IA32寄存器名字空间的限制
  • 高速缓存行长度是64字节或者128字节
  • 硬件预取

Intel NetBurst Microarchitecture Design Consideration

Intel NetBurst微架构的两个主要设计目标是:(1) 高速地处理执行传统的IA32代码与基于SIMD技术的新程序;(2)运行在非常高的频率上,为将来升频至更高的主频预留空间。为了实现这个目标,Intel NetBurst微架构相比上一代P6微架构提供许多新的高级特性以及增强特性。

  • 它采用了超深度流水线,允许非常高的运行频率,而且片上的不同部件可以运行在不同的频率上,有些部件比处理器标定频率更快,有些则低于标频。相比起Pentium III处理器,Pentium 4处理器可以达到非常高的时钟频率,实际上远超过1GHz。
  • 通过对常用指令进行优化,流水线在常规情形(例如高速缓存命中)下可以高效的译码和执行这些指令,因此经常碰到的代码序列可以低延迟高吞吐的进行处理。
  • 采用各种技术来代偿流水线停顿产生的性能损失,包括并行执行,缓冲技术,和投机执行技术。而且,由于Intel NetBurst微架构是动态地乱序执行指令,所以针对单条指令的执行时间不总是确定的(即不可预测)。由于执行时处理器状态的不同,相同代码序列的运行性能也可能会有所差异。

由于Intel NetBurst微架构“微妙的”复杂性,Pentium 4的优化文档推荐的优化原则与方法以及要避免的情况,只是给出了一个相对的优先考虑,通常并不代表绝对的可以量化的性能期望与性能损失。尽管在前几代有序的微架构实现上,量化是可行的,但是现在在Pentium 4处理器上,就不太可行了。

Pentium 4处理器架构/微架构/流水线 (3) - NetBurst微架构相关推荐

  1. Pentium 4处理器架构/微架构/流水线(1) - 概述

    Pentium 4 Architecture Overview 本节简要的介绍Pentium 4处理器的关键特性.这些特性提供了很好背景知识,用于理解详细的代码优化原则. Pentium 4处理器上用 ...

  2. Pentium M处理器架构/微架构/流水线(1) - 流水线概述

    Intel® Pentium® M Processor 与Intel NetBurst微架构类似,Intel Pentium M处理器微架构 的流水线也包括3个主要部分: 有序发射前端 乱序超标量执行 ...

  3. Pentium 4处理器架构/微架构/流水线 (9) - NetBurst执行核详解 - 执行单元与发射口

    Execution Units and Issue Ports 每个时钟周期,执行核可能向4个发射口中的1个或多个口分发微指令.在微架构层面,存储操作进一步被分为两个部分:存储数据以及存储地址操作.下 ...

  4. Pentium 4处理器架构/微架构/流水线 (7) - NetBurst前端详解 - 分支预测

    Branch Predication 对于使用深度指令流水线的处理器,分支预测能力至关重要.分支预测使得处理器可以在分支指令决断之前就开始执行(预测的)分支路径指令.分支延迟是由于分支预测错误导致的性 ...

  5. Pentium 4处理器架构/微架构/流水线 (6) - NetBurst前端详解 - 取指/译码/缓存

    Intel NetBurst Pipeline Details Front End Pipeline Details 本节讲述的关于流水线前端操作的详细信息可能会对软件在指令预取,分支预测以及执行跟踪 ...

  6. Pentium 4处理器架构/微架构/流水线 (4) - NetBurst框图

    Intel NetBurst Microarchitecture Overview 与前几代处理器一样,Pentium 4的微架构包括3个主要部分: 有序发射前端 乱序超标量执行核 有序退役单元 流水 ...

  7. Pentium M处理器架构/微架构/流水线 (2) - 数据预取/乱序核/退役单元

    Data Prefetching Intel Pentium M处理器支持3种预取机制: 第一种是硬件指令预取,已在上面章节中讲述 第二种是自动的将数据预取到二级缓存.这个机制基本上与Intel Ne ...

  8. Pentium 4处理器架构/微架构/流水线 (10) - NetBurst执行核详解 - 高速缓存/数据预取

    Caches Intel NetBurst微架构支持最多达3级的片上高速缓存.Pentium 4处理器上只实现了两级片上缓存结构,主要面向于桌面计算环境.最接近处理器执行核的缓存级,即一级缓存,包含独 ...

  9. Pentium 4处理器架构/微架构/流水线 (5) - 流水线前端/乱序执行核/退役单元

    The Front End Intel NetBurst微架构前端有两个主要部件组成: 取指/译码单元 执行跟踪高速缓存(简称跟踪缓存Trace Cache,或TC) 前端的基本工作如下: 预取有可能 ...

最新文章

  1. html post no js,接受POST请求的Node.js服务器
  2. mp3 音频 音乐 tag ID3 ID3V1 ID3V2 标签 读取信息 获得图片 jpeg bmp 图片转换(上)
  3. 深入理解Linux调度子系统
  4. Maven排除项目中同名不同版本的jar
  5. java astar_JAVA-Astar算法实现
  6. 二维傅里叶变换深度研究-图像与其频域关系
  7. app.use()方法详解
  8. 一个简易的FTP客户端软件
  9. Express 路由
  10. 字节序Endian与字节序标记BOM详解
  11. winxp找不到服务器或 dns 错误,详解网络无法使用DNS错误的修复步骤
  12. 常用的SQL语句大全-单表操作
  13. 12. 查询表product——查询库存商品中,最高单价、最低单价分别是多少
  14. 小米手机开发者选项怎么打开
  15. 计算机管理员已禁用了teredo,Win7提示设备管理器中出现叹号设备“Teredo tunneling pseudo-interface”...
  16. 阿里云和腾讯云服务器哪个好用?
  17. java 查看对象内存占用大小
  18. [交易策略]MACD金叉买死叉卖模型回测
  19. Spring核心原理及工作方式
  20. 马自达推出首个混合动力车型

热门文章

  1. R语言学习笔记(九)聚类分析
  2. 基于android的视频播放器,基于Android的视频播放器的设计与实现-.doc
  3. 分布式日志收集系统Apache Flume的设计详细介绍
  4. 利用pandas,matplotlib画饼图
  5. 2_less中的数值运算
  6. android 自定义域名,Android基于Retrofit2改造的可设置多域名的网络加载框架
  7. 编程实现Strassen矩阵乘法
  8. java 打包 根目录_java – Maven在jar文件的根目录中打包图像
  9. mysql 数据拆分_MYSQL-将数据拆分为多行
  10. python字典中文键值对重复_在YAML中将重复的键值对追加到嵌套字典中