OpenGL + OpenGL ES +Metal 系列文章汇总

本案例的目的在于理解顶点数据的两种存储方式以及它们的区别和应用场景

在Metal 入门级02:加载三角形案例中,顶点数据的存储使用的是数组,当顶点传递时通过setVertexBytes(_:length:index:)方法,主要是由于绘制三角形时,所需的顶点只有3个,顶点数据很少,所以可以通过数组存储,此时的数据是存储在CPU中的。那当顶点数据很多时,我们如何存储及传递呢?

针对setVertexBytes(_:length:index:)方法在苹果的官方文档中有如下说明
对于小于4KB(即4096字节)的一次性数据,使用setVertexBytes(_:length:index:),如果数据长度超过4KB 或者需要多次使用顶点数据时,需要创建一个MTLBuffer对象,创建的buffer的目的就是为了将顶点数据存储到顶点缓存区,GPU可以直接访问该缓存区获取顶点数据,并且buffer缓存的数据需要通过setVertexBuffer(_:offset:index:)方法传递到顶点着色器。

下面以一个案例来说明MTLBuffer的使用,案例的整体效果如图所示

整体的执行流程如下

与Metal 入门级02:加载三角形案例相比,主要是以下两部分的变化

  • Render渲染循环类:大批量顶点数据数据的存储及传递
  • metal文件:顶点坐标需要归一化处理
    其他的视图控制器及OC与C的桥接.h文件均没有任何变化,具体请参考文末完整代码

渲染循环类

主要是修改大批量顶点数据的存储及传递,涉及以下两个函数

  • initWithMetalKitView函数:产生大量顶点数据并将数据存储到buffer中
  • drawInMTKView代理方法:顶点数据的传递到顶点着色器通过setVertexBuffer(_:offset:index:)方法

initWithMetalKitView函数

该函数主要是初始化GPU设备以及加载metal,流程如图所示

主要分为以下两步

  • 初始化device
  • loadMetal函数:加载metal

初始化device
通过视图控制器中初始化render对象时传入的MTKView对象view,利用view来获取GPU的使用权限

_device = mtkView.device;

loadMetal函数
该函数主要是初始化metal的一些准备工作,加载metal大致可以分为几步

  • view设置绘制纹理的像素格式
mtkView.colorPixelFormat = MTLPixelFormatBGRA8Unorm_sRGB;
  • 加载.metal文件 & 顶点着色和片元着色函数

  • 创建渲染管道,并命名 & 设置渲染管道的顶点和片元function & 设置颜色数据的组件格式

  • 创建渲染管线状态 & 判断是否创建成功
    以上几步,基本上是使用metal绘制图形时的必备操作,在Metal 入门级02:加载三角形案例中已经有详细说明,这里不在过多说明

  • 获取顶点数据

    • 通过generateVertexData函数生成大批量的顶点数据
    • 初始化MTLBuffer对象,该buffer存储的数据,可以由GPU直接读取
      使用buffer的原因是顶点数据的大小超过了4KB,如果再用数组存储,从CPU传递到GPU,性能开销会非常大,所以苹果官方文档建议,当有大批量顶点数据时,需要创建MTLBuffer对象来存储数据
    • 将顶点数据复制到顶点缓存区,通过缓存区的content内容属性访问指针
    • 计算顶点个数
      通过顶点数据的长度 除以 单个顶点的大小 得到顶点的总个数
//    5、获取顶点数据NSData *vertexData = [CJLRenderer generateVertexData];
//    创建一个vertex buffer,可以由GPU来读取_vertexBuffer = [_device newBufferWithLength:vertexData.length options:MTLResourceStorageModeShared];
//    复制vertex data 到vertex buffer 通过缓存区的"content"内容属性访问指针/*memcpy(void *dst, const void *src, size_t n);dst:目的地 -- 读取到那里src:源内容 -- 源数据在哪里n: 长度 -- 读取长度*/memcpy(_vertexBuffer.contents, vertexData.bytes, vertexData.length);
//    计算顶点个数 = 顶点数据长度 / 单个顶点大小_numVertices = vertexData.length / sizeof(CJLVertex);
  • 通过device创建commandQueue命令队列
_commandQueue = [_device newCommandQueue];

drawInMTKView代理方法

在viewDidload函数中设置view的delegate的对象为render``,即在自定义的渲染循环类中处理view的委托代理方法,其中view默认的帧速率与屏幕的刷新速率是一致的,所以每当屏幕刷新时,就会调用MTKViewDelegatedrawInMTKView`绘制方法来进行图形渲染,drawInMTKView方法的流程图如下

主要分为以下几部分

  • 创建命令缓存区 & 命名
  • 创建renderPassDescriptor渲染描述 & 判断渲染描述是否为空
    • 当渲染描述符不为空时,继续往下执行
    • 当渲染描述符为空时,直接跳转至commit提交
  • 创建commandEncoder命令编码器
  • 设置视口
  • 设置渲染管线状态
  • 传递数据
  • 绘制图形
  • 结束commandEncoder工作
  • 通过presentDrawable渲染到屏幕上
  • 将commandBuffer提交至GPU

以上几步,除了传递数据部分,其他都是图形渲染的必须步骤,在文章开头提及的案例中均有说明,下面着重说下传递数据部分

在init初始化函数中,顶点数据的存储是使用buffer存储的,所以顶点数据的传递也需要使用与buffer相对应的传递函数setVertexBuffer,而viewpoertSize数据的传递仍然可以使用setVertexBytes函数,所以其实
buffer 和 bytes传递是可以混合使用的

函数 参数
setVertexBytes:length:atIndex 参数1-bytes:指向传递给着色器的内存指针
参数2-length:想要传递的数据的内存大小
参数3-Index:对应的索引
setVertexBuffer:offset:atIndex 参数1-buffer:需要传递数据的缓冲对象
参数2-offset:从缓冲器的开头字节偏移,一般传0
参数3-atIndex:对应的索引
//我们调用-[MTLRenderCommandEncoder setVertexBuffer:offset:atIndex:] 为了从我们的OC代码找发送数据预加载的MTLBuffer 到我们的Metal 顶点着色函数中/* 这个调用有3个参数1) buffer - 包含需要传递数据的缓冲对象2) offset - 它们从缓冲器的开头字节偏移,指示“顶点指针”指向什么。在这种情况下,我们通过0,所以数据一开始就被传递下来.偏移量3) index - 一个整数索引,对应于我们的“vertexShader”函数中的缓冲区属性限定符的索引。注意,此参数与 -[MTLRenderCommandEncoder setVertexBytes:length:atIndex:] “索引”参数相同。*///将_vertexBuffer 设置到顶点缓存区中,顶点数据很多时,存储到buffer[commandEncoder setVertexBuffer:_vertexBuffer offset:0 atIndex:CJLVertexInputIndexVertices];//可以buffer 和 bytes传递混合使用//将 _viewportSize 设置到顶点缓存区绑定点设置数据[commandEncoder setVertexBytes:&_viewportSize length:sizeof(_viewportSize) atIndex:CJLVertexInputIndexViewportSize];

Metal文件

.metal文件中,在顶点着色函数需要对顶点坐标进行归一化处理,因为顶点数据初始化时使用的是物体坐标。顶点坐标的归一化主要有以下几步:

  • 初始化输出裁剪空间位置
  • 获取当前顶点坐标的xy:主要是因为绘制的图形是2D的,其z都为0
  • 将传入的视图大小转换为vector_float2二维向量类型
  • 顶点坐标归一化:可以通过一行代码同时分隔两个通道x和y,并执行除法,然后将结果放入输出的x和y通道中,即从像素空间位置转换为裁剪空间位置
vertex RasterizerData
vertexShader(uint vertexID [[vertex_id]],constant CJLVertex *vertices [[buffer(CJLVertexInputIndexVertices)]],constant vector_uint2 *viewportSizePointer [[buffer(CJLVertexInputIndexViewportSize)]])
{/*处理顶点数据:1) 执行坐标系转换,将生成的顶点剪辑空间写入到返回值中.2) 将顶点颜色值传递给返回值*///    1、定义outRasterizerData out;//    2、初始化输出剪辑空间位置,将w改为2.0,实际运行结果比1.0小一倍out.clipSpacePosition = vector_float4(0.0, 0.0, 0.0, 1.0);//    3、获取当前顶点坐标的xy,因为是2D图形// 索引到我们的数组位置以获得当前顶点// 我们的位置是在像素维度中指定的.float2 pixelSpacePosition = vertices[vertexID].position.xy;//将vierportSizePointer 从verctor_uint2 转换为vector_float2 类型vector_float2 viewportSize = vector_float2(*viewportSizePointer);//    4、顶点坐标归一化处理//每个顶点着色器的输出位置在剪辑空间中(也称为归一化设备坐标空间,NDC),剪辑空间中的(-1,-1)表示视口的左下角,而(1,1)表示视口的右上角.//计算和写入 XY值到我们的剪辑空间的位置.为了从像素空间中的位置转换到剪辑空间的位置,我们将像素坐标除以视口的大小的一半.//如果是1倍,除以1.0,如果是3倍//可以使用一行代码同时分割两个通道。执行除法,然后将结果放入输出位置的x和y通道中out.clipSpacePosition.xy = pixelSpacePosition / (viewportSize / 2.0);//    5、颜色原样输出//把我们输入的颜色直接赋值给输出颜色. 这个值将于构成三角形的顶点的其他颜色值插值,从而为我们片段着色器中的每个片段生成颜色值.out.color = vertices[vertexID].color;//完成! 将结构体传递到管道中下一个阶段:return out;}

总结

顶点数据的存储方式有两种

  • 通过数组存储在CPU,需要利用setVertexBytes:length:atIndex:函数将顶点数据传递到GPU,这种情况仅适合小于4KB的顶点数据
  • 当顶点数据大于4KB时,需要将顶点数据存储在MTLBuffer对象,即顶点缓存区中,这种存储方式GPU可以直接读取,传递到着色函数时需要通过setVertexBuffer: offset: atIndex:函数

完整的代码见Github - 18_Metal_三角形_OC

Metal 案例03:大批量顶点数据的图形渲染相关推荐

  1. opengl顶点数据传送和着色器处理(vao,vbo)

    OpenGL学习脚印: 顶点数据传送和着色器处理1 写在前面 本节内容翻译和整理自<Learning Modern 3D Graphics Programming>Chapter1内容.作 ...

  2. 项目案例之GitLab的数据迁移

    项目案例之GitLab的数据迁移 链接:https://pan.baidu.com/s/1CgaEv12cwfbs5RxcNpxdAg 提取码:fytm 复制这段内容后打开百度网盘手机App,操作更方 ...

  3. [iTyran翻译]OpenGL ES 从零开始系列08:交叉存取顶点数据

    Technote 2230提出了很多用OpenGL ES来提升iphone程序性能的建议.我们现在远远不能深刻理解OpenGL ES所以你需要学习以下内容.不信?是真的,试试看,我等着你的读后感. 好 ...

  4. Tableau可视化设计案例-03基本表、树形图、气泡图、词云

    文章目录 Tableau可视化设计案例 03基本表.树形图.气泡图.词云 1.基本表 1.1基本表的使用 1.2凸显表的使用 1.3二值凸显表 2.树形图 2.1不同类型酒店数量与评价人数 2.2油尖 ...

  5. 案例03 补充:金字塔等图形边框的绘制

    OpenGL + OpenGL ES +Metal 系列文章汇总 在案例 03:金字塔.六边形.圆环的绘制的文章中,针对边框的绘制,并没有作详细说明,下面将这部分补充完善下. 首先,我们先思考,如果在 ...

  6. Spark Machine Learning 03 Spark上数据的获取、处理与准备

    Chap 03 Spark上数据的获取处理 Spark上数据的获取.处理与准备 MovieStream,数据包括网站提供的电影数据.用户的服务信息数据以及行为数据. 这些数据涉及电影和相关内容(比如标 ...

  7. SQL优化—— 大批量插入数据

    大批量插入数据 环境准备: 当使用load 命令导入数据的时候,适当的设置可以提高导入的效率

  8. MySQL高级 大批量插入数据

    大批量插入数据 环境准备 : CREATE TABLE `tb_user_2` (`id` int(11) NOT NULL AUTO_INCREMENT,`username` varchar(45) ...

  9. Redis进阶实践之十六 Redis大批量增加数据

    原文:Redis进阶实践之十六 Redis大批量增加数据 一.介绍 有时候,Redis实例需要在很短的时间内加载大量先前存在或用户生成的数据,以便尽可能快地创建数百万个键.这就是所谓的批量插入,本文档 ...

最新文章

  1. Python CRC32 文件校验
  2. TCP客户机-服务器
  3. oracle 分列,SQL 问题 如何分列
  4. 翻转二叉树—leetcode226
  5. 10字符串及整数操作符
  6. Go 高性能编程技法
  7. ES5-16【utils】数组方法、类数组
  8. ONLINE_JUDGE
  9. 12.二叉树的序遍历
  10. 【python】整理的 Python 库
  11. Tricks(十八)—— 转置 list of lists
  12. Linux时间子系统之八:动态时钟框架(CONFIG_NO_HZ、tickless)【转】
  13. Dev-cpp5.4.0安装及下载
  14. Vivado官网下载
  15. 【流媒体开发】9、ffmpeg实现视频录制
  16. vue视频通话(Agora声网)
  17. 信用卡收单业务--银行业务(七)
  18. 合作共赢:加密云储——穿针引线,布局IPFS分布式存储领域
  19. 计算机基础实训评分标准,计算机实训考核办法细则.doc
  20. idea左边项目栏目录结构不见了/文件夹在上面显示

热门文章

  1. Xbox 360抢鲜测评
  2. 服务器ahci模式安装系统,u盘装系统硬盘模式怎么设置|u盘装系统BIOS设置ide/ahci方法...
  3. wps里有project吗_甘特图是什么?-如何用WPS表格做甘特图
  4. RT-Thread 01线程调度与管理
  5. 正则表达式与re模块
  6. RFID固定资产管理系统中的RFID标签的使用-新导智能
  7. 计算机基础考试试题(扩招考试),大学计算机科学基础探析论文
  8. 计算机创新创业项目点子,创新创业项目有哪些(创业点子大全500个)
  9. linux删除除非某某文件,find命令查找比某个文件新或...-linux下删除某一时间段的文件-scp命令在两台服务器直接进行文件传输的方法_169IT.COM...
  10. 名帖232 张雨 行书《行书帖选》