设为首页收藏本站 关注微博 关注微信

全球新闻在线

全球新闻在线 首页 科技新闻 IT技术 查看内容

3DMark得到周全的射线追踪功效测试

2021-8-25 09:10| 发布者: wdb| 查看: 80| 评论: 0|原作者: [db:作者]|来自: [db:来源]

摘要: 3DMark得到周全的射线追踪功效测试,更多it技术新闻关注我们。

在最佳的显卡须要不单是在功能和价值上发展竞争,况且对功效。既然RX 6900 XT,RX 6800 XT和RX 6800正好加入Nvidia,以经过硬件扶持光线追踪,咱们真的很想晓得他们在功能方面的相比。谁将在咱们的GPU基准测试体制中得到最高荣誉,假如在启用光线跟进的概况下发展测试,概况将如何改变?

好几年来,游戏中的射线追踪一直备受关心。咱记得在2008年《雷神之锤4敌人领土》(Quake 4 Enemy Territory)具有原型射线追踪模块时。它看上去很酷,可是功能却很差。在16核CPU上以16 fps 720p播放?可是至少这是甚么!

快闪十年了,英伟达的RTX硬件承诺了出色的品质和功能。除了RTX卡以外,游戏依然运用混合渲染方法,此中许多数渲染是运用惯例方法达成的,光线跟进仅在实是产生以后才利用,以实现少许特定的成果,比如反射或阴影。

运用当今扶持光线跟进计算的现代GPU,在游戏上发展全路径跟进须要做甚么?Quake II RTX和Minecraft RTX曾经做到了这一丝,可是他们是较老的且不太繁杂的游戏,具备路径跟进功效。此刻,UL为3DMark添加了一项功效测试,该测试对皇家港口基准发展了产业的全光线跟进渲染。(请注意,您将须要Advanced或Pro版原本访问DirectX光线跟进功效测试,如其所称。)

咱们喜爱能够在各式GPU上相比“纯”光线跟进功能的想法。3DMark DXR功效测试此刻为咱们提供了另一个方法,虽然它无汇报每秒射线/三角形相交的数量(这是咱们真实想要见到的),但它切实提供了与光线跟进硬件干脆相干。咱们将当前的RTX GPU发展了汇总,以供参考。更要紧的是要见到AMD将要面世的Big Navi,RX 6900 XT,RX 6800 XT和RX 6800都将在下个月左右公布。

咱们经过DXR功效测试运转了全部RTX卡,但RTX 2070和2080除外(他们应当落在新的Super变体之中的当中位子)。的的GeForce 3090 RTX是在4X的功能RTX 2060时,RTX 2080钛的两倍以上的速度是2060位,和的GeForce 3070 RTX是略快于2080钛。RTX 3090也比GeForce RTX 3080快19%,这比咱们测试过的许多数游戏都要大。根本上,这边的事宜更多地遭到GPU的节制,因而理论功能终归挨近现实。

多近?咱们运用RT内核的数量,GPU时钟和RT内核的生成来计算少许数字。Nvidia显示,第二代30系列RT内核比第一代20系列RT内核快约70%。比如,这意指着3070应当比2080 Ti FE快约7%,而2080 Ti应当比RTX 2060快150%。

30系列GPU的扩展差不多十足适合预期。3070切实比2080 Ti快了7%,3080比3070快了48%(预期为47%),而3090比3080快了19%(比较预期为19.5%)。

可是,在20系列零件上的结果终归浮动很大。2060超等版比2060快14%(预期为11%)。可是,2070 Super仅比2060(理论上的41%)快35%,2080 Super快65%(理论上73%),而2080 Ti快127%(上理论上150%)。虽然如许,这差不多充足挨近受人尊敬的举止和良没有问题起点。

咱们也想在某些非RTX GPU上运转DXR功效测试,但它根本上是在嘲笑咱们并嘲笑咱们的硬件。“您微不足道的GTX 1660 Super和GTX 1080 Ti没有办法料理光线追踪的真相!” 实质上,它叮嘱咱们咱们的硬件不扶持运转测试所需的DXR Tier 1.1功效集。关于GTX上的DXR,经过驱动程序和着色器hack来讲是如许:光线跟进硬件提速是必要的。

很大的难题:AMD的RX 6800,RX 6800 XT和RX 6900 XT相关于RTX 3070,RTX 3080和RTX 3090的价值如何?依据理论估算,6900 XT可能会降落在3070和3080之中的当中位子,而6800 XT会比3070快一丝,而RX 6800则位于2080 Ti和2080 Super之中。可是理论上的功能估算可能与实质概况不符,咱们一律有兴趣在本月晚些时刻见到概况如何。

对于3DMark DXR功效测试,另有好多要讨论的内容。比如,它的运转形式与咱们预期的不太一样。默认设计以1440p的像素每像素12个随机样本发展渲染,而且像许多数路径跟进算法一样,这点样本的输入被组合起来以给出终归的像素颜色结果。接下来再一次采样,结果品质获得提升。平常,将循环此进程,直到达到所需的品质水准。

难题在于3DMark DXR Feature Test实时发展全部采样和累加。样本计数指定累积速率,并在物体活动时干脆作用图像品质。可是,一朝相机停止搬动,您终归将得到每个情景类似的第一大品质结果(通过相同的总时间)。

运用2采样设计时,相机最初搬动时,与默认的12采样设计比较,物体看起来有点颗粒感,而默认设计为12采样设计。可是,一朝相机暂停几秒钟,屏幕上的结果就会最初快速收敛。察看这点图像品质相比。

统一情景的上述画廊展览相片右后摄像机暂停,直到不过此前它再一次最初转动。因而,前三个“最初”图像是“最差”品质,而三个“完毕”图像是“最好”品质。请注意,屏幕抓图来源运用ShadowPlay发展的视频捕获,因而您应当疏忽少许紧缩伪像。这是为了使每种设计的捕获相同帧变得愈加简单。(这点结果来源RTX 2080 Ti。)

视频紧缩伪影会掩藏您在情景活动时会见到的众多其它噪声,尤其是在2采样设计上。可是,即便在稳固图像的时间很短的概况下,也要审查图像看起来有多类似。三个“终归”结果根本相同,独一的区分是随机采样的播放形式。可是,到日前为止,第一大的要素是功能。

运用RTX 2080 Ti,默认12个样本的平均功能为30.2 fps。每个像素下调到两个样本,功能将跃升至165 fps,而将采样数增添到每个像素20个样本,则功能将仅下调至18.1 fps。换句话说,每帧每像素的采样数差不多干脆作用功能。

咱想见到的是一个在各式样本计数之上运转的深度学习衍生降噪算法。自然,默认概况下2样本图像品质十分嘈杂,可是Quake II RTX也是如许。请看之下示例:

“嘈杂”图像的运转速度提升了15%至25%,可是假如您实质上是想制作一款可玩的游戏,它的效用会很大。接下来的指标是做充足的样本以得到可行转换为更好看成果的图像。想想DLSS,但除了上调幅度外,它还可行消除噪声并以绝对的形式在各个像素之中发展插值。

得到挨近完美的路径跟进结果所需的每个像素的随机样本数平常为数百。关于实时游戏利用而言,这不会很快产生。可是,Quake II RTX应允您调度用于照片形式的样本数量,范畴从100到8000。

最多须要一分钟的时间来渲染1080p的单个帧,而100个样本可行很快达成。同一时间,图像品质在基线100个样本以上不会有很大浮动,可是假如您要渲染比Quake II更繁杂的游戏可能会更要紧。

抉择更多的样本,更低的功能和更高的图像品质;或更少的样本,更没有问题功能和更低的图像品质。在游戏中,要想在品质和功能之中寻到一种良没有问题平衡,就须要应用更高品质的光线跟进渲染技艺。在照片形式之外,Quake II RTX每个像素仅运用几个样本,而且可行轻松达到RTX显卡上的可玩功能。

自然,另有几个难题。起首,为了发展去噪,它能否须要Nvidia的Tensor内核,仍是可行经过FP16在常规GPU着色器上达成(使其与AMD GPU兼容)?它将对功能发生多大作用?

更要紧的是,十足光线追踪的游戏或图形能否要紧的??难题。当前的光线追踪游戏平常运用混合渲染方法,光栅化料理许多数底层图形,而且光线追踪成果仅用于反射,阴影或全局照明之类的事物。可是,假如混合渲染可行在以更快的速度运转时得到相同的视线成果,那非是最好的全体成果吗?

一种难题是,混合渲染须要用于惯例栅格化的全部代码以及用于光线跟进的代码,这意指着游戏开发人士可能须要做更多的事业。再说一次,源于虚幻引擎和Unity中内置了对光线跟进的扶持,这比您可能碰到的难题要少。不论如何,咱们不太可能在一会儿的将来放弃栅格化。

更多IT技艺关心咱们。