Freeway:Maximizing MLP for Slice-Out-of-Order Execution
Freeway: Maximizing MLP for Slice-Out-of-Order Execution
摘要:
- 问题:
- 为了能够掩盖内存和LLC的长访问延迟,充分的利用MLP将非常重要。尽管当前OOO处理器中能够有效的利用MLP,但是硬件复杂,能效低,能耗大
- 之前的工作:sOOO(slice-out-of-out)是一种相对于OOO核能效更高的,能够利用MLP的微架构。这种结构将存储指令和相关指令构建成为代码片段,并且相对于剩余的指令,乱序的执行(slice内部和剩余指令都是按序,两者相对乱序)
- sOOO的问题:在存储指令代码片中的指令由于是按序执行,会出现不相关的的指令阻塞后面的代码片中后面的指令执行(不同的slice之间,由于按序执行,导致slice之间的阻塞)
- 论文工作:Freeway,一种新的sOOO微结构,设计了一种新的可感知相关(dependence-aware)的slice执行策略,这种策略可以跟踪相关的slices,并使它们不受MLP提取的影响
- 结果:Freeway相对于之前的sOOO的性能提升了12%
- 问题:
介绍:
- 乱序执行可以提取MLP,因为可以同时将不相关的ready的多个存储操作同时发射执行,但是这种架构的能耗也非常大。例如OOO中的指令队列的结构通常是CAM结构(content addressable memory),这种
Freeway:Maximizing MLP for Slice-Out-of-Order Execution相关推荐
- Keras之MLP:利用MLP【Input(8)→(12)(relu)→O(sigmoid+二元交叉)】模型实现预测新数据(利用糖尿病数据集的八个特征实现二分类预测
Keras之MLP:利用MLP[Input(8)→(12)(relu)→O(sigmoid+二元交叉)]模型实现预测新数据(利用糖尿病数据集的八个特征实现二分类预测 目录 输出结果 实现代码 输出结果 ...
- 【深度学习基础】数字手势识别实验:2.MLP
本实验系列文章目录如下,相关代码(python)托管在我的Github - SIGNS experiment,欢迎访问: 1.任务描述 2.MLP 3.Momentum 4.Batch-Norm 5. ...
- 2023-05-20:go语言的slice和rust语言的Vec的扩容流程是什么?
2023-05-20:go语言的slice和rust语言的Vec的扩容流程是什么? 答案2023-05-20: go语言的slice扩容流程 go版本是1.20.4. 扩容流程见源码见runtime/ ...
- MICCAI 2022:基于 MLP 的快速医学图像分割网络—UNeXt
MICCAI 2022:基于 MLP 的快速医学图像分割网络 UNeXt 文章目录 前言 方法概述 UNeXt 架构 TokMLP 设计思路 实验部分 一些理解和总结 参考链接 前言 最近 MICCA ...
- seaborn可视化条形图并按照升序排序条形图进行可视化:Sort Bars in Barplot in Ascending Order in Python
seaborn可视化条形图并按照升序排序条形图进行可视化:Sort Bars in Barplot in Ascending Order in Python 目录
- 解决:Command line is too long. In order to reduce its length classpath file can be used.
前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家.点击跳转到教程. 1. 原本可以正常运行的项目,突然出现这个错: Command line is too long. ...
- Mysql系列 - 第八篇 :详解排序和分页(order by limit),及存在的坑
这是Mysql系列第7篇. 环境:mysql5.7.25,cmd命令中进行演示. 代码中被[]包含的表示可选,|符号分开的表示可选其一. 本章内容 详解排序查询 详解limit limit存在的坑 分 ...
- 【Go】Go基础(六):数组、切片slice、映射map
1.数组 1.1 数组定义 数组:数组是具有相同 唯一类型 的一组已编号且长度固定的数据项序列. 数组长度必须是一个常量表达式,并且必须是一个非负整数.数组长度也是数组类型的一部分,所以[5]int和 ...
- 基于OpenCL的深度学习工具:AMD MLP及其使用详解
from:http://www.csdn.net/article/2015-08-05/2825390 [编者按]深度学习是近年来迅速发展和突破的机器学习领域,具有非常广泛的应用前景.将服务器GPU应 ...
- ViP解读:视觉MLP结构新作
最近的一篇新的视觉MLP方面的工作,天津大学程明明组参与其中,通过充分利用2D特征图的位置信息设计的一个MLP结构ViP(Vision Permutator),获得了相当不错的性能. 简介 论文提出一 ...
最新文章
- 全球自动驾驶汽车发展指数哪家强?美德领衔,中国第七
- RFC 协议下载方法
- 就是一个人写代码做软件项目也建议用版本管理器也要考虑采用异地容灾手段...
- scrollBy与scrollTo的区别与用法
- Java黑皮书课后题第6章:*6.5(对三个数排序)使用下面的方法头编写方法,按升序显示三个数
- 无法定位程序输入点 在.exe上_win7提示explorer.exe应用程序错误的解决方法
- 实验2 操作系统的引导
- 【复习】快速幂算法详解
- u-boot移植随笔:u-boot2010.09移植到8MB Nor Flash的S3C2440,第一步搞定(补记)
- linux debian 8.3 发布时间,Robolinux 8.3 发布下载,基于 Debian 的 Linux 发行
- [BZOJ2820]YY的GCD
- python对比php开发web_django学习系列——python和php对比
- python实现bt下载器_10行 Python代码使用磁力链接批量下载种子
- 计算机控制技术复试面试(一)
- matlab 数据白化,数据白化
- 强化学习——多智能体强化学习
- PDPS软件:导出AutoCAD可编辑的2D布局图
- 基于MThings配置MODBUS数据中常见的几种时间概念介绍(超时时间、间隔时间、轮询时间)
- 仓库 “http://ppa.launchpad.net/chris-lea/node.js/ubuntu bionic Release”
- iPhone手机经常有些APP图标前面有个小云朵,点击图标后,进行转圈下载,提示正在载入......