DDR 输出带宽:
640M*8byte=5.1GB/s(其中8byte受限为DMC/BUS宽度的影响)

latency read:107ns
latency write:43ns

outstanding:
read :9 transactions ,write:3 transactions
burst length:7 ;
transfer size:3;

L2 cache:64K
target performance :gfxbenchmark
MALI-T820 MP1
Manhattan
FPS :2.1fps
BW(rw+wr):255.2MB/frame=536.134MB/s
T-Rex:
FPS:6.5fps
BW(rw+wr):166.7MB/frame=1.08355GB/s
Egypt HD:
FPS:18.5fps
BW(rw+wr):56.1MB/frame=1.03785GB/s
Egypt classic
FPS:18.5fps
BW(rw+wr):20.7MB/frame=836.28MB/s

i)理论计算带宽: rbw=wbw=1.6795GB/s,
     busmonitor 测量带宽:rbw  = 1.80783GB/s    ,wr =  209.408MB/s
 ii)读通道带宽与理论计算带宽相差 较少,主要是实际GPU会读少量的job descriptor ,但理论计算中忽略job descriptor ;

写通道的带宽与理论带宽相差较大,主要是因GPU的TE进行对写进行了优化,根据波形的busmon_wbw_cnt中的字节总量为

133.1988Mbyte左右,约等于2个16K的FB容量(4096*4096*4*2)大小。

calculate antutu6.0 3D score:
garden: fps*1000*0.62
maroon: fps*1000*1.35

GPU write  测试条件:

1)GPU OD :600MZH ,MP1;

2)DDR fre  :640M

3) CPU :1.3GHZ

GPU RW/WR bandwidth :

t=8.0685S ,BW =3.1014GB/s;

GPU filltare:

t=56.436028S ,fillrate=567.013375M pixels/s;

GPU performance tunning相关推荐

  1. (转)Performance Tunning for Tile-Based Architecture Tile-Based架构下的性能调校

    转自:http://www.cnblogs.com/gameknife/p/3515714.html#commentform Performance Tunning for Tile-Based Ar ...

  2. Performance Tunning for Tile-Based Architecture

    Performance Tunning for Tile-Based Architecture Tile-Based架构下的性能调校 by Bruce Merry GameKnife译 译序 在大概1 ...

  3. Performance Tunning

    「转自」http://langyu.iteye.com/blog/1341267 Performance Tunning8mins, 44sec TO 3mins, 45sec硬件级别 提高磁盘IO的 ...

  4. System Performance Tunning Tools

    最近终于把Brendan Gregg大神的力作<Systems Performance: Enterprise and the Cloud>给看完了,前往系统调优的道路上还有很多路要走,最 ...

  5. Windchill Performance Tunning

    詳見附件. 通過下面的地址可以下載﹕ http://space.itpub.net/attachments/2011/01/22453766_201101171937111.jpg 擴展名需改在.zi ...

  6. performance tunning --shared pool

    SHARED POOL都有那些东西? LIBRARY CACHE--发给ORACLE的SQL,PLSQL代码都需要解析编译,对于那些已经编译好的,随时可以执行的代码都放在LIBRARY CACHE中, ...

  7. gpu浮点计算能力floaps_聊聊 GPU 峰值计算能力

    1.前言 2020 年 5 月 14日,在全球疫情肆虐,无数仁人志士前赴后继攻关新冠疫苗之际,NVIDIA 创始人兼首席执行官黄仁勋在自家厨房直播带货,哦不对应该是 NVIDIA GTC 2020 主 ...

  8. Optimizing graphics performance

    Optimizing graphics performance 看U3D文档,心得:对于3D场景,使用分层次的距离裁剪,小物件分到一个层,稍远时就被裁掉,大物体分到一个层,距离很远时才裁掉,甚至不载. ...

  9. 针对深度学习的GPU芯片选择

    转自:http://timdettmers.com/2014/08/14/which-gpu-for-deep-learning/ It is again and again amazing to s ...

最新文章

  1. springframework引入不进来_啥?你不知道JWT
  2. 开关电源异址替换实战割接
  3. Django + Uwsgi + Nginx 的生产环境部署
  4. [转]Asp.Net Core 简单的使用加密的Cookie保存用户状态
  5. ubuntu16.04设置ssh免密码登录
  6. ubuntu中安装wmware-tools
  7. spark之2:原理介绍
  8. Linux下mysql整库备份
  9. java string 精度_Java 中的浮点数取精度方法
  10. 怎样让百度快速收录的新方法
  11. php hbase thrift,php通过thrift操作hbase
  12. ArcGIS学习总结(五)——地形分析-TIN及DEM的生成
  13. 有道翻译与VS2010滚动栏自动反弹冲突问题
  14. 【数据技术】利用Python获取高德地图POI数据——以上海瑞幸门店为例
  15. win10相机计算机无法使用,win10系统相机怎么用 win10系统相机无法使用怎么解决...
  16. z变换判断稳定性和因果性_信号与系统(奥本海姆)
  17. winform窗口的切换
  18. you和帆船(枚举)
  19. 什么是Galil(加利尔)运动控制卡,它是用来干嘛的呢?galil开发文件dmc32.dll,动态链接库,API
  20. (原创)通过DrawingCache截取View图片

热门文章

  1. 2022 TQLCTF nemu
  2. 软件过程管理第二章(软件开发活动)
  3. python批量删除微信好友_我用 Python 找出了删除我微信的所有人并将他们自动化删除了...
  4. Kruskal算法与并查集
  5. python中的int函数是什么意思
  6. 简单教会你如何获取1688/阿里巴巴商品详情
  7. JAVA解析.xlsb文件
  8. Python实现替换照片人物背景,精细到头发丝 | 机器学习
  9. 用C语言编写你自己内核
  10. 天涯上截取的当前经济周期的看法