GPU performance tunning
DDR 输出带宽:
640M*8byte=5.1GB/s(其中8byte受限为DMC/BUS宽度的影响)
latency read:107ns
latency write:43ns
outstanding:
read :9 transactions ,write:3 transactions
burst length:7 ;
transfer size:3;
L2 cache:64K
target performance :gfxbenchmark
MALI-T820 MP1
Manhattan
FPS :2.1fps
BW(rw+wr):255.2MB/frame=536.134MB/s
T-Rex:
FPS:6.5fps
BW(rw+wr):166.7MB/frame=1.08355GB/s
Egypt HD:
FPS:18.5fps
BW(rw+wr):56.1MB/frame=1.03785GB/s
Egypt classic
FPS:18.5fps
BW(rw+wr):20.7MB/frame=836.28MB/s
i)理论计算带宽: rbw=wbw=1.6795GB/s,
busmonitor 测量带宽:rbw = 1.80783GB/s ,wr = 209.408MB/s
ii)读通道带宽与理论计算带宽相差 较少,主要是实际GPU会读少量的job descriptor ,但理论计算中忽略job descriptor ;
写通道的带宽与理论带宽相差较大,主要是因GPU的TE进行对写进行了优化,根据波形的busmon_wbw_cnt中的字节总量为
133.1988Mbyte左右,约等于2个16K的FB容量(4096*4096*4*2)大小。
GPU write 测试条件:
1)GPU OD :600MZH ,MP1;
2)DDR fre :640M
3) CPU :1.3GHZ
GPU RW/WR bandwidth :
t=8.0685S ,BW =3.1014GB/s;
GPU filltare:
t=56.436028S ,fillrate=567.013375M pixels/s;
GPU performance tunning相关推荐
- (转)Performance Tunning for Tile-Based Architecture Tile-Based架构下的性能调校
转自:http://www.cnblogs.com/gameknife/p/3515714.html#commentform Performance Tunning for Tile-Based Ar ...
- Performance Tunning for Tile-Based Architecture
Performance Tunning for Tile-Based Architecture Tile-Based架构下的性能调校 by Bruce Merry GameKnife译 译序 在大概1 ...
- Performance Tunning
「转自」http://langyu.iteye.com/blog/1341267 Performance Tunning8mins, 44sec TO 3mins, 45sec硬件级别 提高磁盘IO的 ...
- System Performance Tunning Tools
最近终于把Brendan Gregg大神的力作<Systems Performance: Enterprise and the Cloud>给看完了,前往系统调优的道路上还有很多路要走,最 ...
- Windchill Performance Tunning
詳見附件. 通過下面的地址可以下載﹕ http://space.itpub.net/attachments/2011/01/22453766_201101171937111.jpg 擴展名需改在.zi ...
- performance tunning --shared pool
SHARED POOL都有那些东西? LIBRARY CACHE--发给ORACLE的SQL,PLSQL代码都需要解析编译,对于那些已经编译好的,随时可以执行的代码都放在LIBRARY CACHE中, ...
- gpu浮点计算能力floaps_聊聊 GPU 峰值计算能力
1.前言 2020 年 5 月 14日,在全球疫情肆虐,无数仁人志士前赴后继攻关新冠疫苗之际,NVIDIA 创始人兼首席执行官黄仁勋在自家厨房直播带货,哦不对应该是 NVIDIA GTC 2020 主 ...
- Optimizing graphics performance
Optimizing graphics performance 看U3D文档,心得:对于3D场景,使用分层次的距离裁剪,小物件分到一个层,稍远时就被裁掉,大物体分到一个层,距离很远时才裁掉,甚至不载. ...
- 针对深度学习的GPU芯片选择
转自:http://timdettmers.com/2014/08/14/which-gpu-for-deep-learning/ It is again and again amazing to s ...
最新文章
- springframework引入不进来_啥?你不知道JWT
- 开关电源异址替换实战割接
- Django + Uwsgi + Nginx 的生产环境部署
- [转]Asp.Net Core 简单的使用加密的Cookie保存用户状态
- ubuntu16.04设置ssh免密码登录
- ubuntu中安装wmware-tools
- spark之2:原理介绍
- Linux下mysql整库备份
- java string 精度_Java 中的浮点数取精度方法
- 怎样让百度快速收录的新方法
- php hbase thrift,php通过thrift操作hbase
- ArcGIS学习总结(五)——地形分析-TIN及DEM的生成
- 有道翻译与VS2010滚动栏自动反弹冲突问题
- 【数据技术】利用Python获取高德地图POI数据——以上海瑞幸门店为例
- win10相机计算机无法使用,win10系统相机怎么用 win10系统相机无法使用怎么解决...
- z变换判断稳定性和因果性_信号与系统(奥本海姆)
- winform窗口的切换
- you和帆船(枚举)
- 什么是Galil(加利尔)运动控制卡,它是用来干嘛的呢?galil开发文件dmc32.dll,动态链接库,API
- (原创)通过DrawingCache截取View图片