vinjn.com Democratizing Visual Computing

#纯干货#加速 VR 渲染地狱难度进阶篇之降低图形 API 调用次数

2015-09-05

准备好,中文互联网终于有人开始严肃地讨论 VR 技术了。纯干货文章,直奔主题。

VR 渲染的难点是什么?

左眼和右眼看到的场景是不同的,因此同样的 API 需要调用两次。以 Oculus DK2 为例,头戴显示器分辨率为 1920 X 1080,viewport 均分为左右两部分,各为 960 X 1080。这意味着 CPU 和 GPU 的工作量相比传统三维游戏都要增加,如何降低额外的一次绘制的开销是这篇文章的重点。

VR 地狱有几层?

先来四层:

  • 整个场景画两次:先绘制左眼看到的场景,然后绘制右眼看到的场景。
  • 每个物体画两次:对于场景中的物体依次绘制,物体 1 左眼 -> 物体 1 右眼 -> 物体 2 左眼 -> 物体 2 右眼 -> 按照左右左右的顺序绘制。
  • 硬件 Geometry Shader 技术:只绘制一次,用硬件 Geometry Shader 生成左右两个场景。
  • 硬件 Instancing 技术:只绘制一次,用 instancing 技术生成左右两个场景。

第一层:整个场景画两次

优点 - 最容易实现

缺点 - 效率低下,不论是 CPU 还是 GPU

左眼渲染结束后,同样的 API 在右眼部分依然需要重复。

第二层:每个物体画两次

优点 - 容易实现,可显著降低 API 调用,贴图、Shader、顶点缓存等不用修改。

SV_ViewportIndex 可以用于选择多个 Viewport。

缺点 - draw call 依然存在重复。

仅仅需要修改右眼的摄像机的状态(View Matrix)和 视口(Viewport)。

第三层:硬件 Geometry Shader 技术

优点 - 看上去很美,硬件加速,不需要重复 API 调用。

缺点 - 需要修改 Shader 流水线以支持 GS,同时部分硬件平台不支持 GS,而且 GS 的效率非常糟糕(某显卡:怪我咯)!

第四层:硬件 Instancing 技术

优点 - 不涉及额外的状态切换,比 GS 快三倍!

缺点 - 不支持两只眼睛渲染到不同到 render target 上(暂时不是问题),同时老版本的 GLES 不支持 Instancing。

Instancing 的特点是 CPU 只上传一次顶点数据,让 GPU 批量渲染多次。也就是场景中所有物体的 Vertex Buffer、Index Buffer、Texture 以及渲染状态只设置一次,一个物体也仅仅 draw 一次。

但是前面提到左右眼的 View Matrix 和 Viewport 是不同的,只 draw 一次怎么解决这个问题呢?

float4x4 WorldToEyeClipMatrix[2]; // 由 VR 设备的 SDK 获取
float4 EyeClipEdge[2]={(-1,0,0,1), (1,0,0,1)};
float EyeOffsetScale[2]={0.5,-0.5};
uint eyeIndex = SV_InstanceID & 1; // 最低位作为眼睛的索引值:0 为左眼,1 为右眼。

float4 clipPos = worldPos * WorldToEyeClipMatrix[eyeIndex];
SV_CullDistanceOut.x = SV_ClipDistanceOut.x = clipPos · EyeClipEdge[eyeIndex];

clipPos.x *= 0.5; // 渲染范围的宽度缩小一半
clipPos.x += EyeOffsetScale[eyeIndex] * clipPos.w; // 根据是左眼 or 右眼来向左 or 向右移动
clipPositionOut = clipPos;

正确答案是这段 HLSL Vertex Shader 伪代码,详细的解释留待下一篇文章。

总共十八层的地狱,小张只探索到第四层,等大家打怪练级经验涨上去了,后续关卡会依次开放。

​本文部分选自 <Timothy Wilson - High performance stereo rendering for VR>


vinjn.com - Democratizing Visual Computing


Content