在传统SMP系统上,所有CPU都以同样的方式通过一个共享内存控制器来访问内存,各CPU之间也是通过它来进行交流,所以很容易造成拥堵。而一个内存控制器所能够管理的内存数量也是非常有限的。此外,通过唯一的hub访问内存造成的延迟也是非常高的。
 
在NUMA结构下,每个计算机不再只有唯一的内存控制器,而是把整个系统分成多个节点。每个节点分别有自己的处理器和内存。系统中所有的节点都通过全互联的方式连接。所以,每当在系统中增加新的节点,系统所能够支持的内存和带宽都会增加,具有非常好的扩展性。
 
下面就讲讲NUMA的内存组织
 
在NUMA系统中,每个CPU可以访问两种内存:本地内存(Local Memory)和远端内存(Remote Memory)。和CPU在同一个节点的内存称为本地内存,访问延迟非常低。和CPU在不同节点上的内存叫做远端内存,CPU需要通过节点互联方式访问,所以访问延迟要比访问本地内存长。
 
从软件的角度来看,远端内存和本地内存是以同样的方式访问的。理论上讲,NUMA系统可以被软件视为与SMP同样的系统,不区分本地和远端内存。但是如果追求更好的性能,这个区别还是需要被考虑的。
 
经实验,对于常规的内存操作,如清空(Memset),块复制(Memcpy),流读写(Stream),指针追溯(Pointer Chase)等操作来说,本地内存的访问速度要远远优于远端内存。
 
由于 NUMA 同时使用本地内存和远端内存,因此,访问某些内存区域的时间会比访问其他内存区域的要长。本地内存和远端内存通常用于引用当前正在运行的线程。本地内存是指与当前正在运行线程的 CPU 位于同一节点上的内存。任何不属于当前正在运行的线程所在的节点的内存均为远端内存。访问远端内存的开销与访问本地内存的开销比率称为 NUMA 比率。如果 NUMA 比率为 1,则它是对称多处理 (SMP)。比率越高,访问其他节点内存的开销就越大。不支持 NUMA 的 应用程序有时在 NUMA 硬件上的执行效果非常差。
 
由于访问本地内存和远端内存的开销是有区别的,所以在NUMA模式下,如果每个线程更多的是访问本地内存,那么性能相比而言会有一定提升。

转载于:https://blog.51cto.com/intelisn/130482

NUMA与英特尔下一代Xeon处理器学习心得(4)相关推荐

  1. NUMA与英特尔下一代Xeon处理器学习心得(2)

    上回说到NUMA的一个简介,现在再扯扯NUMA与英特尔下一代Xeon处理器的关系,咱们切入正题  做为英特尔下一代的45nm Xeon处理器, 它会成为未来英特尔从台式机.笔记本到服务器全线产品的主流 ...

  2. NUMA与英特尔下一代Xeon处理器学习心得

    本文转自:http://software.intel.com/zh-cn/blogs/2008/11/24/numaxeon1/ 作为一名工程师,一名做技术的工程师,NUMA也是我的近期工作重点之一. ...

  3. Numa与Intel下一代Xeon处理器学习

    NUMA与英特尔下一代Xeon处理器学习心得(1) 作者: 陈宇达 (Intel) (8 篇文章) 日期: 十一月 24, 2008 在 1:27 下午 作为一名工程师,一名做技术的工程师,NUMA也 ...

  4. NUMA与英特尔Xeon处理器学习心得 转

    作为一名工程师,一名做技术的工程师,NUMA也是我的近期工作重点之一.在工作时间,在茶余饭后,也看了些NUMA的资料,学习了英特尔下一代Xeon处理器.这里就是我的一点小结,一点心得,和感兴趣的朋友分 ...

  5. 英特尔发布Xeon D-1600处理器:10nm工艺 性能提升40%

    据十次方获悉,今天英特尔再次推出了全新的Xeon D-1600系列产品. 全新的Xeon D-1600处理器在此前发布的D-1500系列基础上,提供了最多八核的强悍处理性能.全新新品主要面向边缘网络. ...

  6. 全新英特尔®凌动™处理器E3900系列:支持下一代智能互联的物联网设备 —— 这个全新处理器系列把计算能力迁移到更靠近传感器的位置,从而减轻把所有处理工作推向数据中心的需求...

    物联网让数十亿智能互联设备互相连接,正在改变人们的生活和工作方式.到2020年,互联设备的数量预计将显著提高,500亿个设备(思科IBSG)每年产生44 ZB(44万亿字节)的数据,并且在端和雾网络中 ...

  7. 英特尔凌动处理器_英特尔Daniel Rodriguez:驾驭2020云网融合浪潮 | 5G on IA

    本博客文章作者:Daniel Rodriguez 英特尔公司副总裁兼网络平台事业部总经理 释放跨云.网络和边缘数据的力量,为新业务的增长带来了巨大机遇.这是一个持续由新技术浪潮驱动的过程,并受到网络云 ...

  8. 英特尔下一代服务器cpu消息,英特尔下一代Sapphire Rapids服务器CPU曝光

    最近根据外媒消息,代号为 "Sapphire Rapids"的下一代HEDT高性能桌面CPU的路线图被曝光.HEDT平台的定位是顶级桌面处理器,但是低于服务器CPU,接口与桌面平台 ...

  9. 英特尔凌动处理器_曾押宝英特尔凌动CPU,华硕手机如今活得如何了?

    其实说起华硕手机,相信还有不少人对其依然存在深刻印象.其中,华硕ZenFone系列确实打造出三星Galaxy系列的"统一感",理论上他们的产品迭代分布乃至产品规格都很足,但为何如今 ...

最新文章

  1. 中国大学MOOC-C程序设计(浙大翁恺)—— 时间换算
  2. Spring Cloud应用开发(五:API网关服务)
  3. Netty面试题 汇总
  4. MySQL学习笔记之九:MySQL Replication
  5. mysql 时间取日期函数_mysql 获取当前日期函数及时间格式化参数详解
  6. virtualenv 模块
  7. HC-05蓝牙模块基本使用
  8. 【朝夕技术专刊】Core3.1WebApi_Filter多种注册方式支持依赖注入
  9. python入门第三天
  10. Facebook: 亿级向量相似度检索库Faiss 原理+应用
  11. Noip模拟题解题报告
  12. 【基础】如何理解LSTM后接CRF?
  13. SilverLight跨域访问及其常用的几种解决方法
  14. windows win10调节外接显示器亮度
  15. 选个关注热度上升的大数据工具学习下吧
  16. 魔兽世界-按键精灵脚本(1)-自动小宠物战斗
  17. 小程序商城如何精细化运营?
  18. 实验4-1-12 黑洞数
  19. win10下java的下载、安装和配置环境教程,超级详细
  20. CAD文件怎么打印成黑白图片教程

热门文章

  1. iOS - UIEvent事件及UIResponder响应者
  2. Ubuntu android 开发配置
  3. 【Android开发坑系列】之PopupWindow
  4. cocos2d-x多分辨率自适配及因此导致的CCListView的bug修复
  5. live555学习笔记3-消息循环
  6. ASP.NET MVC数据标记验证
  7. 深度学习高能干货:手把手教你搭建MXNet框架
  8. 20位大佬组团“踢馆”,谁超越了图灵?
  9. 双非本科上岸北大,复试成绩专业第一!
  10. 有哪些道理是我当了程序员后才知道的?