您最后一次在 PC 或游戏机上玩视频游戏是什么时候?如果它是最受欢迎的游戏之一,您可能已经注意到图形的逼真程度。今天,最先进的 PC 和主机游戏中的图形正在接近我们在电影中看到的真实感。
创建逼真的实时计算机生成图形的最重要元素之一是场景的照明。渲染 3D 图形的传统方式(光栅化)在模拟逼真的光照和阴影方面并不是最强大的技术。这是因为光栅化的工作原理是将虚拟多边形网格化为 3D 模型,然后将这些模型分解为必须单独着色的像素,而这个过程需要大量的工作和计算资源,并且经常需要复杂的开发人员技术。
电影动画师早就知道这一点,转而使用光线追踪技术来制作全局照明、阴影和反射等效果。光线追踪是一种轻松准确地模拟光线行为的方法,可以让场景看起来更逼真,并且创建工作量更少。该技术更符合人眼看待世界的方式,光线从环境中的物体反射回来,并根据物体的材料成分吸收/反射光线。
因为光线追踪可以实现更逼真的效果,开发人员可以使用它为游戏玩家创造更加身临其境的体验。而且由于使用光线追踪比使用传统光栅化更容易创建这些效果,因此它可以腾出开发人员的时间来处理游戏的其他方面。
然而,在游戏中使用光线追踪技术的缺点是,要获得真正身临其境的体验,光线追踪必须实时完成。这意味着必须在几分之一秒内渲染图像,这使得它在处理和资源方面的成本高得令人望而却步。
今天,市场上的硬件可以在控制台和 PC 游戏中启用实时光线追踪效果,但它被选择性地用于仅照亮场景中最关键的对象,并且在某些情况下,用户可以决定如何使用它。考虑到性能限制,他们可以决定是否要使用它来生成反射与阴影,或者完全使用它——他们可能会选择关闭它以优化帧速率。底线是存在性能权衡。
当前具有光线追踪功能的硬件通过提供比前几代更多的光线追踪处理来提高性能,但它需要更多的硅面积和更多的功率。如今,在功率受限的设备中实现实时光线追踪极具挑战性,因此该技术还没有为手机游戏玩家的屏幕增添光彩。然而,由于移动游戏将在 2021 年占全球游戏市场的 52% ,因此这是一个不容忽视的图形人口统计数据。
当今移动设备中的图形
尽管尚未获得光线追踪技术的帮助,移动图形质量仍在继续提高。随着图形变得越来越逼真,使用传统技术制作它们的能力变得越来越复杂,这将性能、带宽和功率要求推向了移动处理器的极限。
阴影的产生就是一个很好的例子。阴影生成传统上是通过级联阴影贴图完成的——这个过程需要大量的几何处理、大量缓冲区的分配、以高分辨率处理多个渲染目标以及昂贵的着色器操作。在处理周期、功耗和带宽方面的成本是巨大的。而且,在所有这些投资之后,结果仍然不如通过使用光线追踪以更容易的方式创建的结果那么现实。
使用光线追踪技术,光线从单个像素发送到光源,如果光线击中某物,该区域就会处于阴影中。每像素一条射线使这成为一个简单、廉价且直接的过程,尤其是在使用专用硬件的情况下。传统光栅化遇到的许多分辨率问题、伪影和其他挑战(例如避免浮动几何所需的偏置)在光线追踪中不存在。只要可以有效地实现专用硬件,创建光照和阴影效果就变成了一个微不足道的挑战。
今天,该行业正处于一个交叉点,使用阴影贴图和其他传统技术进行的近似变得如此昂贵,以至于实时光线追踪实际上正在成为一种更有效的选择。此外,随着我们接近摩尔定律的终结,我们不能再指望可编程硬件每两年以指数方式变得更强大。因此,为了继续加快光线追踪技术的进步,特别是对于功率受限的移动平台,业界必须寻求高效设计的固定功能加速器解决方案。
在移动设备中不断制作更好的图形的关键在于硬件和开发人员优化技术的效率。
光线追踪硬件的现状
实时光线追踪技术长期以来一直是 3D 图形的圣杯。光线追踪可以在不同级别的性能和效率下执行,为了突出这一点,Imagination 建立了光线追踪级别系统(RTLS),识别了从 0 级到 5 级的六个级别的光线追踪。最初的硬件加速光线追踪工作 –我们在 RTLS 量表上所说的 0 级并不是最优的。这些解决方案功能有限,需要定制硬件和应用程序编程接口 (API)。当然,这些解决方案对开发人员来说并不是很有趣。市场随后发展到“1 级”解决方案,该解决方案在传统 GPU 上使用基于软件的计算。这样的解决方案提供了更大的灵活性,但距离理想还有很长的路要走。
我们今天在市场上看到的大多数光线追踪技术(例如用于 PC 和游戏机)都是我们所说的 2 级 RTLS 解决方案。这些具有用于光线追踪最基本和最广泛操作的专用硬件:针对相交的方框和三角形测试光线。将其放入固定功能的硬件中可以获得更好的电源效率,但对于移动设备来说仍然不够好。在 GPU 计算核心上的软件着色器程序中,还有多个额外级别的光线追踪过程需要完成,更糟糕的是,这些处理阶段对 GPU 内的并行执行引擎并不友好。这也导致传统图形效果的性能降低,并且在使用算术逻辑单元(ALU)管道方面效率不高,
当今市场上最复杂的光线追踪解决方案处于 3 级。这些解决方案在专用硬件中实现了更多的光线追踪功能,卸载了着色器内核以提高效率。在此级别,涉及遍历包围体层次结构 (BVH)(光线追踪的主要数据结构)的完整光线相交处理在专用硬件中实现。这提高了更复杂场景的光线追踪效率,并更好地卸载了光线追踪功能,减少了对传统图形性能的影响。
但是,这些解决方案仍然缺乏使光线追踪在移动设备中成为可能所需的基本组件:相干性收集。由于光线倾向于在许多不同的方向上散射,如果不解决相干性问题,GPU 通常具有的许多并行性优势就会丧失。这会导致较低的带宽利用率、复杂的数据访问模式以及着色器管道处理效率的降低。虽然这些解决方案可能声称可以实现每秒高千兆射线,但它们通常效率低下。这可能与 GPU 处理资源的低利用率或内存访问限制有关,这是由于光线在整个场景中的散射导致的非相干内存访问模式造成的。
要让实时光线追踪在移动设备中成为现实,它与效率、利用 GPU 中固有的并行性以及开发用于硬件优化的智能算法有关。需要的是更智能的硬件解决方案。
更智能的光线追踪硬件
该行业必须超越 3 级硬件,才能在移动设备中实现实时光线追踪。在 Imagination,迄今为止,我们已经为超过 100 亿台移动设备提供了 3D 图形技术。我们知道如何在高效的硬件中提供令人惊叹的图形。2016 年,Imagination 的光线追踪开发板已经比当今市场上的解决方案更加复杂。现在,我们将 4 级 RTLS 光线追踪解决方案推向市场。
在第 4 级,BVH 的光线遍历是在专用硬件中完成的,就像在第 3 级中一样,但更关键的是,光线的相干性排序也是如此。在此过程中,我们将沿同一方向传播的光线分组,从而允许处理大批量以充分利用构成每个 GPU 基础的并行计算方法。
长期以来,我们一直利用 GPU 中固有的并行性以及基于切片的渲染等技术,通过这些技术,我们通过切片的空间局部性排序来提高效率。今天,这是普遍接受的做法。现在,我们通过光线的分类将相同的想法带入光线追踪。通过这种方式,我们提高了宽 ALU 的整体利用率并显着提高了测试效率。对传统图形性能的影响也很小,因为我们几乎将光线追踪处理完全卸载到专用硬件中,让着色器核心可用于所有其他非光线追踪处理。
我们的第 4 级 RTLS 解决方案代表了当今可用的最高光线追踪,并且很快就会采用这种技术实现市场化。借助 Imagination 的 4 级光线追踪 IP IMG CXT,公司可以构建 FP32 光栅化性能高达 9TFLOPS 和光线追踪性能超过 7.2GRay/s 的 SoC,同时实现高达 2.5 倍的功率效率。到今天的 2 级或 3 级解决方案。
开发者优化技术
即使是最高效的硬件仍然可以使用一些帮助来在移动平台上提供最佳图形质量。移动设备的优化比控制台或 PC 更重要,在某种程度上,通过暴力破解带宽和功率预算可用性过高的问题来容忍低效率。手机没有这种蛮力容忍度,因为一切都必须以很小的形式工作,并基于小电池提供的能量运行。手机的特性意味着硬件必须由游戏引擎有效驱动,以确保手机不会过热、降低时钟和降低帧率。这意味着为移动设备创建硬件的关键之一是优化管理热效应。
我们告诉开发人员首先要考虑的是少即是多:并非场景中的每个像素都需要光线追踪。我们建议开发者使用他们的光线追踪预算来获得最大的视觉冲击和游戏体验价值。同样,针对每个三角形测试每条射线也太复杂了。通过构建有效的层次结构,开发人员可以在确定要测试哪些三角形时提高硬件效率。构建最好的加速结构通常最好离线完成。
开发人员还应避免使用所有蛮力算法。像软阴影这样的效果可以通过像素间更智能的采样器模式来实现,并将它们与空间过滤器结合起来,而不是在每个像素中发出许多光线。此外,大多数光线追踪效果可以以较低的分辨率渲染——例如,以四分之一的分辨率进行处理——然后按比例放大。然后可以使用图像的时间和空间属性通过去噪滤波器减轻稀疏采样的光线追踪噪声。其中许多阶段可以折叠在一起,并且可以在传统的 GPU 计算硬件上高效运行。还可以利用几乎每部手机中已经提供的专用神经网络加速引擎。
开发人员可以使用许多其他技术来优化移动设备,例如全局照明的动态探针、API 的周到使用等等。最重要的是,高效的光线追踪硬件与智能开发人员优化相结合,将是让实时光线追踪在移动设备上成为现实的关键。
移动设备的游戏规则改变者
有可能——通过新的高效专用硬件和威廉希尔官方网站 ——将光线追踪技术引入移动设备。这是一个真正的游戏规则改变者。它不仅可以为开发人员提供世界上最大的游戏人群,还可以使移动设备制造商在其产品中进一步实现差异化,并允许开发人员在移动设备上创建新的沉浸式用户体验。
审核编辑:郭婷
全部0条评论
快来发表一下你的评论吧 !