RTX 4080 SUPER首发评测:AD103架构完全体 加料降价的4080替代品

紧赶慢赶,NVIDIA终于是在2月前正式完成了首批RTX 40 SUPER系列家族的布局。而就在今天,该家族的最后一位成员——RTX 4080 SUPER证实跟家见面了。

本次我们拿到的是NVIDIA的RTX 4080 SUPER Founder’s Edition版(下仅展示其名称为RTX 4080 SUPER),又称FE版或公版。其官方MSRP定价为8099元,相较于RTX 4080的9499元要便宜了1400元。所以,相较于另外两款RTX 4070 Ti SUPER以及RTX 4070 SUPER的“评价”,RTX 4080 SUPER显卡完全可以说是“加料还降价” 的存在。

同时,这也是目前其性能仅次于RTX 4090和RTX 4090D之外最强的型号了。所以,本文将使用这块显卡来分别对比其性能更高一筹的RTX 4090以及“最接近AD103-400架构的”RTX 4080,通过这两款显卡的性能来直观了解下RTX 4080 SUPER显卡与其之间的差距。

架构解析:

按照惯例我们还是生成了一副规格对比图,以便大家可以直观的感受到RTX 4080 SUPER与其它显卡之间的参数差异。

RTX 4080 SUPER采用的是AD103-400架构,算是AD103架构的完全体。与RTX 4080相比,RTX 4080 SUPER多了4组SM簇,512个流处理器以及相应的Tenosr核心和RT核心。

且在频率方面,RTX 4080 SUPER要比RTX 4080高了45MHz的Boost频率以及0.6Gbps的等效显存速率。在功耗方面两者都是320W。


RTX 4080 SUPER核心构图

该图其实在RTX 4080公布的时候就已经曝光过(当时该图片名称为AD103_FullChip),由于RTX 4080的AD103-300架构较该图要少了4组SM簇,所以于RTX 4080所使用的AD103-300相比,当时我们就猜测后期可能还会推出一个升级版(当时以为是RTX 4080 Ti)。而这次RTX 4080 SUPER所使用的AD103-400算是这张架构图的正式命名了。


RTX 4080 SUPER的AD103-400-A1核心

最后,由于RTX 40系列显卡的核心架构中,每个SM簇中含有4个第四代Tensor核心以及1个第三代 RT核心,所以,RTX 4080 SUPER的核心构成应为:

80组SM簇*128个流处理器=10240个流处理器

80组SM簇*4个Tensor核心=320个Tensor核心

80组SM簇*1个RT核心=80个RT核心

8个显存控制器*32bit(位宽)=256bit(显存位宽)

8个显存控制器*2GB GDDR6X显存颗粒=16GB显存

显卡外观及包装介绍:

既为Founder’s Edition版,RTX 4080 SUPER的外包装仍为之前RTX 40系相同的长方体造型,黑色的主色调,上边隐约可见GEFORCE RTX 4080 SUPER的标识。

这个长方体造型的包装为2个三角形组合而成,将其掀开后可以看到NVIDIA GeForce RTX 4080 SUPER显卡静静的躺在盒子中。

显卡整体为黑色造型,为双风扇设计,从正面看可以看到位于显卡左侧的风扇,另一个风扇则隐藏在右侧正面散热装甲的下边,为吹透式设计。

从背面看则可以看到第二个风扇,第二个风扇为抽风式设计,显卡的热量被传递到显卡上的散热片后,被右侧的风扇吸走,并吹到机箱的上半部分(内存处),能够起到加强机箱风道的作用。

从背面可以看到显卡上的RTX 4080 SUPER字样。

左侧的风扇吹出来的风则是通过显卡的I/O挡板处进行排出。

此外,该显卡为1个HDMI 2.1a以及3个DP 1.4a接口。

测试平台及测试项目介绍:

由于是显卡性能对比测试,为了保证其它硬件不会对测试结果造成影响。我们尽可能的将其它硬件拔高。本次测试除了微星MEG Z790 ACE MAX主板外,我们特意使用了Intel 14代酷睿的i9-14900K及DDR5-7600MHz 16GB*2内存作为了测试平台的配置。

本次测试为最新版的Windows 11操作系统,并且使用最新版的551.22版显卡驱动。

由于是游戏性能测试,所以我们特别选择了8款带有Benchmark的游戏来加入测试,测试涵盖DLSS 3.5的光线重建功能,DLSS 3.0的插帧功能。使用预设的最高画质,4K/2K及1080P三个分辨率。

Stable diffusion AI绘画性能测试:

在前边我们提及过,RTX 40系列显卡使用的是第四代Tensor核心(也称张量核心),该核心的作用就是用于深度学习和AI运算方面。因此,RTX 40系列显卡在运行AI相关的Stable diffusion(AI绘画)软件时,会变得更加高效。

Stable diffusion的绘画原理是通过加载不同的模组(AI学习的数据库),然后输入自己想要的画面关键词,并进行部分调整(如权重,渲染次数,引擎等),来进行图像生成。

在安装好相应的插件([TRT] sd_xl base_1.0_0.9vae)后,在Stable diffusion中可以就看到TensorRT(深度学习推理SDK)的选项卡了,如此即可实现利用NVIDIA RTX 40系列显卡中的Tensor核心来进行深度学习后的AI计算。

下边我将采用常规AI绘图方式,以及RTX 40系显卡的TensorRT绘图方式来进行对比。

两次AI绘图均采用设置如下:

在设置时,我们统一选择模组(AI学习库)为sd_xl_base_1.0_0.9vae.safetensors,采样步数为50,采样方法为Eular a,提示词相关系数为7,随机数种子为13,图片宽度和高度为1024×1024,总批次数为10,单批数量为1。

首先是常规绘图模式,此时不加载NVIDIA专门的插件,以完全默认的状态仅调整参数来生成AI图像。

测试结果:未使用Tensor核心进行AI计算的RTX 4080 SUPER显卡总计生成图片用时为2分18.6秒(138.6秒)。

之后选择[TRT] sd_xl base_1.0_0.9vae插件,其它参数和之前一样,再进行AI图像的生成。

测试结果:使用Tensor核心进行AI计算的RTX 4080 SUPER显卡总计生成图片用时1分19.7秒(79.7秒)。

测试感想:

从结果来看,开启[TRT] sd_xl base_1.0_0.9vae插件之后,启用Tensor核心来进行处理的RTX 4080 SUPER显卡生成一副标准图像的用时要比未开启该插件快了58.9秒,整体速度快了42%。

这对有需求快速出图,甚至是对图像精度有更高要求的用户来说,降低42%以上的等待时间可以说是提升了近一倍的工作效率。

RTX VSR 视频超分辨率功能测试:

NVIDIA的VSR功能其实就是RTX视频超分辨率,以提升显示效果的功能,该功能位于NVIDIA的控制面板中,在左侧列表最下方的调整视频图像设置中即可找到它。

右侧选项中,点选超分辨率即可开启该功能,质量方面有1-4四个选项。

点击,开启,就是这么简单,你完全不需要其它任何操作,它甚至可以应用于网络视频(即在网上看视频也有相应的变化)。

对此,我使用开启后质量4,以及关闭两种状态下分别播放了一段油管的视频,并使用采集卡进行了记录。之后我将视频一分为二,让大家看看开启VSR功能和关闭VRS功能后,即使是在线观看视频,会有怎样的区别吧。

对比视频:


开启和关闭VSR功能下的一段网络播放视频对比

通过对比视频可以发现,开启RTX视频增强(质量4)后,其画面要比关闭RTX视频增强色彩更加明亮一些,这样的结果就是整个湖水不再像关闭后的那样是给人以“死气沉沉”的感觉。

之后我将视频放大5倍,来观察一下细节方面,得益于光线的增强,山峦背面的阴影处也得到了更多细节方面的表现。

测试总结:

得益于VSR的视频增强,在让视频变得更加明亮之后,许多暗部的细节也得以体现。且这项技术不需要额外下载任何插件,只需要在NVIDIA控制面板中点几下鼠标即可。

应用则是即时的,甚至于哔哩哔哩,油管看网络视频也会有不同的效果。可以说是非常实用的工具了。

D5 Render DLSS实时渲染功能测试:

其实Stable diffusion主要是调用显卡的算力来绘画,而VSR则是NVIDIA控制面板中的功能。这次的D5 Render就是实实在在的软件了。D5 Render是一个实时渲染的工具,它可以帮助用户对生成的场景来进行较为逼真的展现。

但正因为场景展现是实时的,所以在普通显卡进行如此复杂的计算时,它会变得很卡,尤其是特效全开后的表现。

如今的D5 Render已经加入了对DLSS 3.5的支持,使用该技术后,相同场景下表现又会如何?一起来看下吧!

在D5 Render的DLSS 3.5选项中可以看到超分辨率、光线重建以及实时高帧率3个选项。其中光线重建功能是依托于超分辨率上的,即开启后者才能开启前者。

D5 Render的5种模式下场景的不同表现。

通过放大,观察左侧玻璃的反光可以发现,对场景表现有提升的是超分辨率采样以及光线重建功能,两者依次递进的可以更好的将玻璃反光的模糊杂质画面给去除掉(需知D5 Render是渲染器,在这一场景中不应该有灰尘和不干净、凹凸不平的玻璃出现,显然全关后的模糊也是不应该出现的)。

实时高帧率则是在以上的基础上进行了帧率的提升。

最后,我们生成了一个对比表格,以便大家直观了解在D5 Render中,3款显卡在各种场景下的表现。

测试感想:

DLSS的加持,让显卡在运行D5 Render时变得更加轻松流畅,原本RTX 4080 SUPER显卡在默认情况下表现为72帧,开启超分辨率采样后直接上升到了119帧接近120帧平均帧的水平,而在全开之后,帧数再次上涨到平均帧193帧。可以说得益于DLSS 3.5的加持。最终表现是比默认设置有了3倍以上的帧数提升且在画质表现方面得到了增强。

3Dmark相关测试:


3Dmark Speed Way DX12 Ultra性能测试


3Dmark Port Royal光追性能测试


3Dmark Time Spy Extreme DX12 4K性能测试


3Dmark Time Spy DX12 2K性能测试


3Dmark Fire Strike Ultra DX11 4K性能测试


3Dmark Fire Strike Extreme DX11 2K性能测试


3Dmark Fire Strike DX11 1080P性能测试

光线重建及插帧游戏测试:


《赛博朋克2077》4K分辨率开/关光线重建功能测试


《赛博朋克2077》2K分辨率开/关光线重建功能测试


《赛博朋克2077》1080P分辨率开/关光线重建功能测试


《瘟疫传说:安魂曲》4K分辨率开/关帧生成功能测试


《瘟疫传说:安魂曲》2K分辨率开/关帧生成功能测试


《瘟疫传说:安魂曲》1080P分辨率开/关帧生成功能测试

《古墓丽影、地平线》游戏性能测试:


《古墓丽影:暗影》4K分辨率性能测试


《古墓丽影:暗影》2K分辨率性能测试


《古墓丽影:暗影》1080P分辨率性能测试


《地平线:零之曙光》4K分辨率性能测试


《地平线:零之曙光》2K分辨率性能测试


《地平线:零之曙光》1080P分辨率性能测试

《孤岛6、刺客信条》游戏性能测试:


《孤岛惊魂6》4K分辨率性能测试


《孤岛惊魂6》2K分辨率性能测试


《孤岛惊魂6》1080P分辨率性能测试


《刺客信条:幻景》4K分辨率性能测试


《刺客信条:幻景》2K分辨率性能测试


《刺客信条:幻景》1080P分辨率性能测试

热门相关:水恋   上天救命国语   时间商行   马夫的孩子   招待女3