Cyberpunk 2077 RT Overdrive:如何在高端A-A游戏中进行路径追踪
四年来 ,我们已经从能够播放Quake 2的PC所有者转变为应用于Cyberpunk 2077的相同技术,这是周围最苛刻的Triple-A游戏之一 。即使在今天,Quake 2 RTX仍然是运行挑战性的软件 - 但是从RTX 4070到顶级RTX 4090的任何内容都可以以每秒60帧或更高的速度传递那些尖端的视觉效果。问题是 ,如何?
这里没有简单的答案,因为我们在软件和硬件方面都在研究一系列技术创新,这是在后面我们可以开始陷入问题的底层。Quake 2 RTX于2019年6月推出,当时市场上最强大的GPU是Nvidia Geforce RTX 2080 TI 。它设法在1080p左右的情况下可以很好地运行游戏 ,并能够有60fps的空间。但是,将分辨率提高到较高的标准,例如4K和框架率在20年代初期在上层青少年中运行。
四年后 ,最新的GPU通过这些RT计算供电 - RTX 4090的运行速度左右左右 - 尽管在我们探索Ray追踪硬件性能的改进之前,我将强调这只是故事的一部分。开发人员也在努力提高软件方面的效率 。
一段视频深入了解了路径追踪如何从交付Quake 2 RTX到Cyberpunk 2077 RT超速驱动器中发现的惊人视觉效果的四年来发展。
故事必须从某个地方开始,最新图形硬件的进步令人印象深刻。RTX 4090的4X性能增长比RTX 2080 Ti来自硬件中的许多来源:更多的着色器内核和更高的操作频率 ,但其中一些也是建筑的 。例如,每个新的NVIDIA体系结构分别使RT核心中的三角形相交测试吞吐量翻了一番。因此,30系列卡中的安培体系结构可以与20系Turing产品同时测试三角形的两倍。
当您比较RTX 3070运行地震2 RTX与RTX 2080 TI时 ,您可以在实践中看到这一点 。在大多数栅栏标题中,甚至是混合射线跟踪的工作负载,RTX 3070和RTX 2080 Ti Run neck and Neck或RTX 2080 Ti都可以向前拉。但是 ,在纯射线追踪工作量中,RTX 3070性能要好得多。RTX 4090中发现的新的ADA Lovelace体系结构进一步增加了三角形交叉测试,而另一个超过了Ampere 。
在最近的GPU中发现的另一个技术架构优势是更多的L2缓存。这是所有GPU供应商中的一般趋势,但是Intel的Arc和Nvidia的Ada Lovelace架构尤其比其他类似功率的GPU或其最新的前辈的L2缓存量的数量不成比例。例如 ,RTX 3090具有6MB的L2高速缓存,而RTX 4090具有72MB 。英特尔ARC A770具有16MB的缓存,而其Ampere或RDNA 2家族的主要竞争对手却少了很多。
本地4K分辨率的Quake 2 RTX确实在2019年强调了RTX 2080 TI ,但仅通过纯粹的硬件进步,RTX 4090就可以提高4倍的性能。这只是RT Overdrive今天可行的原因之一。
新的RTX 40系列卡还包括着色器执行重新排序(SER) 。在具有高质量的射线追踪或路径追踪的游戏中,游戏世界中的所有材料都有各种各样的着色器。例如 ,在Cyberpunk 2077中,汽车可以具有不同的材料:金属,玻璃 ,透明的外套油漆,仪表板,皮革座椅等等。对于逼真的渲染 ,非常重要的是,在光线弹起时,所有这些材料都会正确尊重和阴影 。
问题在于,射线在场景周围反弹 ,并以随意的方式访问这些着色器,从而在发生时会降低GPU单元利用率 - 这可能会严重降低性能。Ser通过将不同的着色剂捆绑在一起,以防止GPU上访问的数据的分散性质来对抗这一问题。据报道 ,Cyberpunk 2077使用此方法,尽管像L2高速缓存差异一样,很难掌握现实世界的性能含义 ,因为这些不是可以禁用或重新启用用于基准测试目的的功能 。
在过去的四年中,该软件方面也有了巨大的提高,并提高了效率。基本上 ,开发人员开发了射击类似射线的方法,同时获得相似的性能的视觉回报更好。这些主要进步之一来自Restir 。Restir代表时空储层重新采样,并试图回答如何从许多不同的光源中追踪射线的问题 - 至关重要的是 ,Cyberpunk 2077在其霓虹灯浸透的世界中可能有很多。在射线追踪中,为了获得准确的照明结果,您正在以一种非常嘈杂的方式进行采样。您正在将光线发送到场景中,以找出光线的位置和何处 ,结果可能令人难以置信,因此您需要许多,许多射线才能使结果看起来不错 。
在RTX 4090上 ,路径跟踪4K的可能性超过100fps。在1080p时高性能就在这里,这要归功于DLSS性能模式,相同的内部分辨率上升到4K ,只有7%的命中率达到了帧速率7%。同时,DLSS 3框架生成将帧速率提高了57%以上。
这就是为什么在Cyberpunk中追踪的照明是一个挑战:到处都是灯光,您可以绕过角落 ,突然看到一大堆完全不可预测的灯光 。传统的路径示踪剂将需要太多的射线,以至于它开始看起来不错时不会实时执行。这就是为什么Quake 2相对容易追踪照明的原因:在任何给定场景中,很少有光源 ,并且水平很小且预先包装,以在新的灯光上很容易找到并追踪新的灯光即将进入屏幕上并开始影响玩家可以看到的像素。
在Quake 2 RTX中,射线的射线方式完全站不住下来,无法在Cyberpunk 2077之类的诸如Cyberpunk 2077之类的效果中进行表现 - 这种方法已超过现代游戏 ,因此,2018年或2019年不存在的新方法必须首先出现,以使Cyberpunk 2077成为可能 。那就是Restir进出或以其品牌形式的RTXDI形式的地方 - 算法巧妙地重用过去框架中射出的光线 ,并在当前框架中射出的光线,以准确填补重要的本地光源的噪音中的空白。Restir允许追踪最少的射线,并从许多许多光源中返回相对无噪声的照明和阴影。您可以想象 ,如果没有这种追踪Restir提供的许多灯的方法,Cyberpunk 2077 RT超速驱动不可能以当前形式存在 。
除了射线追踪算法的优化之外,我们在图像重建方面还取得了巨大进步。早在2019年Quake 2 RTX推出时 ,DLSS 2甚至都不存在,技术的首次迭代也不符合任务。如今,重建技术是现代PC游戏的既定支柱 ,它改变了我们可以体验GPU繁重体验的方式,例如路径追踪 。例如,在最大化Cyberpunk 2077的RTX 4090上,如果您正在寻找健康的60fps基线 ,则将仅限于1080p分辨率。但是,随着机器学习的进步,我们现在可以拍摄1080p图像 ,实时处理它,以进行性能成本,以重建高达像素量的4倍倍 ,并大大提高图像质量。
路径跟踪的Cyberpunk 2077不仅通过AI升级和更快的硬件实现了 。与旧技术相比,诸如Restir之类的技术变得更加富裕和性能。
最重要的是,我们现在还拥有机器学习辅助框架生成 ,以进一步增强该演示文稿。在2019年,框架的一代是真正闻所未闻的,这是该技术的最后一次引人注目的演示是在10年前的卢卡萨特(Lucasarts)演示了《释放2》中的框架生成版本。2023年 ,我们实际上拥有可行的框架生成技术,现在我们可以使用4K DLSS的性能模式来提高其框架效率,并提高其框架率易变,以提高其效率流动性 。随着框架的产生和图像重建 ,重型射线追踪的体验更加流畅和详细,就可以是四年前。
因此,Cyberpunk 2077 RT Overdrive是许多单独的元素的融合在一起:硬件进步 ,射线追踪算法进步和图像处理的进步 - 所有这些都很快发生了。但是,这不是旅程的终点 。RT Overdrive仍然具有视觉和性能限制。
第一个局限性之一是它如何处理向前渲染的元素 - 例如透明的东西,例如玻璃。这些元素就是为什么我将Cyberpunk 2077描述为“接近路径 ”而不是“完全路径跟踪”的原因 ,因为这些材料仍然没有像不透明的世界几何形状那样通过射线追踪来完全处理 。这仍然是一个开放的研究领域,但是我们已经在其他标题中看到了可能发生的事情的提示。
我们对RT Overdrive的首次介绍集中在Cyberpunk 2077完全没有RT的情况下,以及RT Overdrive如何改善先前的“ Psycho” RT设置。
地震2 RTX具有一些非常引人注目的厚玻璃渲染 ,而虚幻引擎4标题切尔诺贝利特(Chernobylite)也具有一些看起来很棒的射线追踪玻璃折射和阴影 。我想这将是将来可能会进一步改善Cyberpunk RT超速驾驶的领域之一……因为是的,这仍然是一种“技术预览 ”,它仍处于全面发展。
另一个限制是在不透明的几何形状上发生的路径追踪弹跳量 - 目前是两个弹跳 ,从感知现实主义的角度来看,这确实足够了,但是您可以想象到有更多弹跳可以提供帮助的潜在照明条件。根据我从该项目的工程师了解的内容,我认为Cyberpunk 2077可能会更新以使用神经辐射缓存 。基于2021年的演示文稿涵盖了它 - 代替其他方法的神经辐射缓存将对Cyberpunk 2077具有一些有趣的好处。
对于其中一个 ,它将包括缓存中的镜面信息,因此可以通过缓存来处理多声反射,而其他技术则无法做到 ,并且考虑到Cyberpunk世界中的合成材料和金属的数量,这可能是一个很大的好处。它还将提供弥漫性照明信息,因此在游戏中可以准确地以更少的噪音和滞后来准确地代表更多的极端阴影条件。目前 ,主要点燃的区域可能会遇到噪音 。神经辐射缓存中的缓存照明信息可能会完全减轻此问题。
事实证明,路径跟踪的网络朋克比您想象的要可扩展。在此视频中,Rich展示了RTX 20系列和30系列卡可以加入聚会 ,而通过GeForce Now的RTX 4080层的云意味着您可以在不拥有离散GPU的情况下获得良好的4K体验 。
Cyberpunk 2077 Overdrive的最后一个局限性是性能 - 这是有道理的,因为它在AAA游戏中几乎完全是通路跟踪的照明,但是在这里 ,我仍然认为软件方面有改进的余地。例如,现在游戏没有利用OMM或不透明度的微型胶条。这是一种可以通过Ada Lovelace GPU读取的资产格式,可以加快追踪Alpha测试几何形状的成本 - 例如植被 。
如果您现在带着很多叶子去游戏中的区域,您会看到它们比那些具有标准不透明几何形状的区域重得多 ,因此我希望能看到提高的性能。但是除此之外,很难知道 - 但是我在这里发现的一件事是,在RTX 4090上 ,本机4K的游戏如何运行,帧速率与RTX 2080 Ti运行Quake 2 RTX的性能相似。
如果硬件和软件演变的趋势仍在继续,那么在接下来的几年中 ,可能性就会引起人们的吸引力 - 在下一代游戏机硬件到达之前 。我们应该期望看到今天的RTX 4090过滤器的性能向下零件,而高端GPU应该能够进一步推动。即使在今天,我们现在也看到了控制台和PC功能之间的明显鸿沟 ,并取决于开发人员的意愿,而NVIDIA的持续RT福音传播,我们应该开始看到这种质量的视觉效果已在更多游戏中部署。同时 ,毋庸置疑,RT Overdrive值得一看,以及我们有关使技术在当今20系和30系图形硬件上工作的建议 。
相关文章
发表评论