省带宽、耗电小,腾讯游戏学院专家解析手游渲染架构
编者按 如何让手游更省带宽,耗电量更少?渲染或是其中一个可突破的点。本文中,腾讯游戏学院专家Hailong将从为大家解析TBR渲染架构的特点。
什么是TBR?
全称是Tile Based Rendering,主要用在移动设备(手机、平板)上的一种渲染架构,渲染时将屏幕分割成小块,分别渲染。每块大小为16×16 或32×32等(不同产品各不相同),特点是省带宽,耗电小。
与之对应的是IMR(Immediate Mode Rendering),提交的每个渲染要求都会立即开始,这是一种简单而又粗暴的思路,优点缺点都非常明显,如果不用为性能担忧,这种方式会很省事。
片上缓存(On-Chip Buffer)
TBR设备在GPU内部集成有很小的片上缓存(On-Chip Buffer),片上缓存,在渲染时会先将一个Tile内的图像先渲染到片上缓存,然后在拷贝到主显存中。而IMR渲染则是直接由GPU操作显存。片上缓存相比于显存中的Frame Buffer具有更快的访问速度,但是只有很小的存储空间(16×16像素或32×32像素)。
与IMR相比,TBR在GPU上多出一块片上缓存。
IMR与TBR在渲染流程上的对比(红色阴影表示带宽消耗热点)
由上图可以看出,IMR和TBR在带宽消耗上有比较大的差异,左侧的IMR渲染时,Depth Test和Alpha Test等由于需要频繁访问显存,导致有很大的带宽消耗。而右侧的TBR渲染方式由于Depth Test和Alpha Test都只需要跟片上缓存交互即可,避免了和显存之间的带宽消耗。
Tiling(分块)
为了能够按照逐个Tile渲染,在一帧的绘图指令全部提交完成并经过顶点运算后后,会在记录下每个Tile中对应的Triangle List。并保存在FrameBuffer中,等待光栅化时从FrameBuffer读取相应的Tile的TriangleList进行处理。
Resove和Restore
由于GPU的片上缓存的存储空间非常有限,因此渲染完成一个Tile之后,需要将结果复制到FrameBuffer中,这个过程称作Resove。
如果一帧内需要多遍渲染时,在对Tile进行渲染的时候往往需要从FrameBuffer中将对应Tile中旧的数据读取到片上缓存,这个过程称为Restore。
Resove和Restore会导致大量的带宽消耗,需要尽量避免。
如果在渲染过程中需要频繁的切换FrameBuffer,要注意调用顺序,避免浪费带宽。
会导致Resove+Restore的OpenGL ES调用。
- eglSwapBuffers
- glBindFramebuffer
- glTexImage2D,glTexSubImage2D,
- glBufferData,glBufferSubData
- glCopyTexImage2D ,glCopyTexSubImage2
- glReadPixels()
- (参考:Adreno_Developer_Guide.pdf第38页)
实例:为什么在Unity中使用Grap Pass实现屏幕扭曲非常慢?
由于Unity中的Grap Pass是插在渲染过程中的,每渲染一次,游戏买号平台会调用一次glBufferSubData,会导致Resorve和Restore。
可能做的优化:
等场景全部渲染完之后再在最上层叠加一个扭曲效果。
跟其他后处理合并处理。
实例:关于后处理
每个后处理会导至少增加一次Resorve。
可能的优化:
将多种后处理效果放在一个shader中可以减少Resove发生次数。
某些效果低分辨率可以减少带宽。
实例:实时阴影
Shadow map方式实现的实时阴影,需要首先将摄像机放在光源处,将场景深度渲染到一张纹理上,因此除了draw call的增加外,带宽的增加也很多。
- 可能的优化:
- 使用更小的RT。
- 如果能接受的话,可以尝试镇魔曲中影子的做法,即将主角压扁,用黑色纹理渲出来。
减少带宽消耗的建议
1、减少顶点数和图片尺寸。
2、图片压缩(ETC,ATC,PVRTC等)。
3、除界面外,几乎所有贴图都建议生成Mipmap(减小带宽消耗,增加缓存命中)。
4、尽量减少Resove和Restore,尽量减小RenderTexture的尺寸。
- 全屏后处理
- 实时阴影(shadow map)
- 扭曲
- 实时反射
- 5、优化Shader。
- 使用低精度浮点数
TBR特有的两个OpenGL ES扩展
1、Framebuffer Fetch
允许Shader中直接访问片上缓存中当前的颜色和深度。
可以用来实现高效的Color Grading、高度雾之类。
2、Pixel Local Storage
允许在片上缓存中存储和读取自定义的数据格式,大小为每像素128字节或256字节。
可以用来实现高效的延迟光照渲染(在片上缓存中保存G-Buffer)。
关于腾讯游戏学院专家团
如果你的游戏也富有想法充满创意,如果你的团队现在也遇到了一些开发瓶颈,那么欢迎你来联系我们。腾讯游戏学院聚集了腾讯及行业内策划、美术、程序等领域的游戏专家,我们将为全世界的创意游戏团队提供专业的技术指导和游戏调优建议,解决团队在开发过程中遇到的一系列问题。
省带宽、耗电小,腾讯游戏学院专家解析手游渲染架构相关推荐
- mie散射理论方程_腾讯游戏学院专家:PBR渲染模型的理论及具体应用
编者按 PBR,基于物理的渲染模型,是当前主流游戏引擎使用的真实感3D渲染模型.腾讯游戏学院专家Leonn,将和大家分享PBR的理论知识以及在Disney和UE中的典型应用. 文 | Leonn 腾讯 ...
- 腾讯游戏学院专家:UE高级性能剖析技术之RHI
导语如何高效准确详细的对性能进行剖析?腾讯游戏学院专家Leonn将从RHI(渲染提交)开始,归纳总结在UE下对每一性能指标的剖析方法. 基于UE的手游客户端的性能主要由这七大部分构成:CPU逻辑.CP ...
- scratch做简单跑酷游戏_腾讯游戏学院专家:做一个多线程游戏框架可以多简单?...
导语 如何做一个多线程游戏框架?腾讯游戏学院专家Tao将在本文通过一个demo来说说游戏逻辑的多线程化. 众所周知现在各种游戏终端的发展十分迅猛.其中一个共同的特征是"多核化",由 ...
- 腾讯游戏学院专家分析:Unity在移动设备的GPU内存机制
导语CPU和GPU是共享一份内存的吗?腾讯游戏学院专家Donald将在本文尝试以一张贴图纹理的虚拟内存占用为例,解答一些内存方面的问题.本篇主要分析iOS系统,后续会更新安卓篇. 开发手机游戏时,常听 ...
- 腾讯游戏学院专家:如何避免出海游戏服务器水土不服?
曾参加2018GWB腾讯游戏创意大赛的<风暴岛>,获得了WeGame的签约以及腾讯游戏学院专家团的指导,现已于4月在WeGame和Steam双平台上线.本文采访了负责指导服务器方面的专家J ...
- 1709 ltsb 内存占用_腾讯游戏学院专家分析:Unity在移动设备的GPU内存机制
导语 CPU和GPU是共享一份内存的吗?腾讯游戏学院专家Donald将在本文尝试以一张贴图纹理的虚拟内存占用为例,解答一些内存方面的问题.本篇主要分析iOS系统,后续会更新安卓篇. 开发手机游戏时,常 ...
- 腾讯游戏学院专家实例剖析:如何优化休闲游戏的美术风格?
导语:随着人们生活节奏逐渐加快,碎片化时间越来越多,休闲类手游成为了一部分人上下班途中的一大选择.这类游戏玩法不会过于复杂,有时会带有一些收集元素.除此之外,游戏的美术表现也是吸引玩家长期体验游戏的关 ...
- 腾讯首款战争策略手游「乱世王者」的兼容测试之路
作者:lane,腾讯适配测试负责人.WeTest专家兼容测试负责人 商业转载请联系腾讯WeTest获得授权,非商业转载请注明出处. 原文链接:http://wetest.qq.com/lab/view ...
- 红警ol服务器维护,红警OL基地升级条件汇总 腾讯红警OL手游基地升级表
红警OL基地升级条件对于大家升级准备资源非常有帮助,本次文章就是分享详细的基地升级资源的信息,希望能帮助到各位玩家. 零辛工作室也会针对游戏每天更新各种攻略文章,想知道的或者有问题都可以评论留言告诉我 ...
最新文章
- JS --正则表达式验证、实战之邮箱模式
- 微信如何实施微服务?
- Python--一些重要的小tips【持续更新】
- BOOST_PROTO_EXTENDS_MEMBERS宏相关的测试程序
- easyUI下datagrid嵌套显示
- java 自定义注解_Java注解
- 记录一下使用vue/vuex+SSR框架遇到的bug
- html中一个页面大概多少px,当屏幕 (浏览器窗口) 小于 768px, 每一列的宽度是 100% -HTML教程_小白教程_css5.net...
- spring学习--AOP-面向切面编程(一)
- python生成三对角矩阵_块三对角矩阵python
- 在线作图|在线做完整的Lefse分析
- CSS 的关键帧和动画
- HDU 4939 DP
- Winrar 4.0破解
- python爬虫实战-如何批量爬取唯品会商品信息>>>
- Dev C++开发lib和dll
- MFC CListCtrl修改表头字体、字体颜色、背景颜色、字体垂直居中、表头高度
- Kettle读取按行分割的文件
- 题库来源:安全生产模拟考试一点通公众号小程序 安全生产模拟考试一点通:2021年焊工(初级)考试资料为正在备考焊工(初级)操作证的学员准备的理论考试专题,每个月更新的焊工(初级)免费试题祝您顺利通过
- 去掉数组中重复出现元素的算法
热门文章
- scratch跳一跳游戏脚本_涂鸦骑士3D版强势屠榜,腾讯跳一跳“宝刀未老” | 休闲新游周报...
- prometheus变量_Prometheus 数据可视化
- lesson1-python3运算符
- 利用Python爬取糗事百科段子信息
- 机器学习:SVM训练,SMO算法描述,启发式选择样本或变量
- 01背包问题:回溯法和限界分支、递归和迭代方式
- 针对【H-2017年信息基础班(周一班)】某些同学恶意使用lyl洛谷的谴责
- C/C++ strict-aliasing
- Mac系统的终端显示git当前分支
- magento更新产品状态报错