我们都知道虽然RTX 30系列显卡已经发布很长时间了,只不过大多数产品都是中高端的,玩家们最期待的甜点级“60”系列显卡则犹抱琵琶半遮面,迟迟没有发布。NVIDIA当然知道市场最大的需求就是入门级的“60”系列显卡,就拿之前的GTX 1060来说吧,凭借着出色的1080P分辨率游戏表现,造就了玩家心目中的一个经典型号。
现在好消息来了,在CES 2021大会上,NVIDIA正式发布了RTX 3060显卡,并在发布会上直接指出它的目标就是去替代GTX 1060的位置,成为玩家们在1080P分辨率下可以畅玩RTX游戏并达到60帧的甜点显卡。我们今天就通过这张ROG STRIX RTX 3060 O12G GAMING来看看,这全新的RTX 3060到底水平如何。
RTX 3060 采用的GA106-300核心
RTX 3060 采用了GA104-300-A1核心,核心面积276mm2,生产工艺依然是三星为NVIDIA定制的8nm工艺。
GA106-300核心是第一次亮相,从上图我们可以清楚的看到它拥有三组GPC,前两组GPC内有5组TPC,最后的一组GPC则是砍掉了一组TPC,也就是两个SM单元,每个SM单元拥有的CUDA核心是128个。所以GA103-400的CUDA数量就是(3*5*2-2)*128=3584个。
当然,基于新一代Ampere架构的RTX 3060显卡相比RTX 2060 SUPER显卡还多了这一代安培显卡的一些通用特性。
NVIDIA Ampere架构简介
RTX 30系显卡上的SM单元相比RTX 20系的,最大变化是加倍了针对传统计算的FP32单元、引入第二代RT Core以及第三代Tensor Core。
大家都知道在Turing架构中,NVIDIA整数型(INT32)和单精度浮点型(FP32)两种不同的数据类型交给两种不同的ALU进行计算。不过现代游戏应用中最为常见的还是FP32,因此为了提高计算效率NVIDIA在NVIDIA Ampere 架构上引入了可同时支持INT32或FP32两种数据类型的新ALU。也就是说,现在有两条不同的数据路径,一条能够同时处理整数或者单精度浮点,另一条则单纯处理处理单精度浮点计算。
负责进行实时光线追踪运算的专用硬件单元RT Core在NVIDIA Ampere 架构上也更新到了第二代,最主要是增加了动态模糊的加速运算支持。NVIDIA在其中新加入的插值算法可以在保证动态模糊精确性的同时提高了实时光线追踪效率,官方表示最高可达8倍于上代的速度。另外在基础的BVH计算上,第二代RT Core也可以比第一代快2倍。
Tensor Core这个负责运行AI计算的硬件单元在NVIDIA Ampere 架构上也升级到了第三代。其实之前发布的A100计算卡上已经用上了新的第三代Tensor Core,它能够提供比第二代Tensor Core高出4倍的效能,不过游戏卡上面的Tensor Core进行了一定的精简,其FP16 FMA计算的吞吐量只有GA100核心中的Tensor Core的一半。
而第三代Tensor Core带来的更强劲AI运算有些什么用呢? 答案就是DLSS。随着RTX 30系显卡一同发布的,还有DLSS的更新版 - DLSS 8K。顾名思义,DLSS 8K就是通过深度学习技术将画面分辨率拉伸至8K的新版DLSS,具体来说就是把1440P的画面拉伸至4320P,像素数量跨越了整整9倍。
将不同类型的计算交给不同的单元去处理是从NVIDIA Volta架构就开始采纳的一种理念,当时引入的Tensor Core分流了很多AI相关的运算,而在其后引入的RT Core又将实时光线追踪相关的计算给分流了。但在Turing架构GPU上做不到全部运算都能够并行执行,到了Ampere架构上,NVIDIA提升了GPU内部各种单元之间的并行性,现在传统计算单元、RT Core和Tensor Core这三大单元可以同时工作,在原本基础上继续缩短帧渲染时间。
再之后就是HDMI 2.1这个备受期待的新输出端口了。在HDMI 2.1之下,显卡可以用单线材做到8K60Hz或者4K120Hz的输出。对于想用大尺寸电视打游戏的玩家来说是一个不错的福音。
最后当然就是NVIDIA新推出的RTX IO了。这项技术是NVIDIA借助微软此前推出的DirectStorage API来实现的,将会作为插件的形式与后者整合,可以让显卡绕开CPU直接读取SSD数据,从而降低CPU的占用率。不过由于RTX IO需要依靠Windows的DirectStorage API,并且还需要游戏开发商做针对性的优化,所以最快我们也要等到明年才能看到这项技术的具体应用。
NVIDIA Reflex
伴随RTX 30系显卡一同发布的,有一个对于电竞游戏,或者更仔细地说对于电竞选手来说很重要的新东西,那就是NVIDIA Reflex。那么这个NVIDIA Reflex到底是什么东西呢?其实它是分为两部分的,一部分是硬件,一部分是软件。
硬件部分是一个与我们这次使用的LDAT很相似的东西,叫Reflex Latency Analyzer,它其实可以视作为LDAT的一个进阶版本,是直接预安装在显示器里的,可以用来测量玩家从点击鼠标直到画面出现变化之间的时间差,也就是整套系统的所有延迟。
而软件部分则是NVIDIA Reflex SDK。这个NVIDIA Reflex SDK的作用是降低以及测量渲染延迟的,开发者可以直接整合到游戏内。而在开启其低延迟模式后,可以让CPU与显卡同步,大幅度减少渲染序列,从而降低渲染延迟。
NVIDIA Broadcast
NVIDIA Broadcast是为直播主们推出的,这用到RTX GPU的AI能力来对直播主的背景消除或替换,还有摄像头重构图,甚至帮助麦克风进行背景噪音消除。
在安装了NVIDIA Broadcast软件后,它会在摄像头、耳麦与直播软件之间建立一个中间者的角色,让外置设备可以利用到RTX GPU的AI能力来做一些AI增强效果,耳机和麦克风现在支持了降噪功能,AI会分析出哪些是主要音频,哪些是背景杂音进行降噪,给直播主和观众呈现清晰、有用的声音。
而摄像头现在有了自动重构图以及背景处理能力,从摄像头采集到画面,可以设置经过Broadcast进行处理,再传到OBS这些直播软件中,这可以让直播主的背景变得更为生动灵活,同时也可以降低直播场景的搭建成本。
显卡外观
这次RTX 3060是没有公版的,因此我们选择了广受好评的ROG STRIX RTX 3060 O12G GAMING来代替进行首发评测,首先这张显卡在外观上就彰显了这代华硕的ROG猛禽显卡设计语言,虽然内置的GPU核心有所降级,但是ROG的味还是足足的。ROG STRIX RTX 3060 O12G GAMING的三围是300*133.56*53.5mm,整卡的厚度为2.7槽。
背面也是质感非常棒的金属背板设计,左侧采用了这代非常流行的镂空散热设计,这可以极大的提升散热效率。
进气格栅设计
侧面的话,ROG STRIX RTX 3060 O12G GAMING依旧简约不简单,除了左上角的“GEFORCE RTX”字样,下方的RGB灯带是这代ROG猛禽显卡的标志设计。
供电采用单8PIN设计
接下来看一下ROG STRIX RTX 3060 O12G GAMING的I/O部分,两个字“良心”,我原本以为华硕会在低端产品上放弃这次广受好评的多接口设计。但当我拿到卡时,我依旧发现华硕相当有诚意的给到了2个HDMI 2.1接口以及三个DP 1.4接口,如果不出意外的话,其他品牌的3060在接口数量上是不会超越这张ROG STRIX RTX 3060 O12G GAMING的。
这次的ROG STRIX RTX 3060 O12G GAMING在外观设计上比较硬朗,手感跟质感很棒,“GEFORCE RTX”字样作为点缀,颇有立体感。
最后ROG STRIX RTX 3060 O12G GAMING依旧提供了两档风速调节,默认是性能模式,本次测评也使用性能模式进行测试。
显卡拆解
拆开ROG STRIX RTX 3060 O12G GAMING,首先PCB正面我们一眼就看到了两个显存的空焊位,恩,看样子3060也是有可能做256位宽的。显卡采用8+2共计10相供电设计,这对于RTX 3060来说已经是非常充沛有余了。
PCB背面
核心背面电容
上图就是这次ROG STRIX RTX 3060 O12G GAMING的GA106-300-A1核心了,它的核心面积为276mm2,生产工艺依然是三星为NVIDIA定制的8nm工艺。其拥有三组GPC,前两组GPC内有5组TPC,最后的一组GPC则是砍掉了一组TPC,也就是两个SM单元,每个SM单元拥有的CUDA核心是128个。所以GA103-400的CUDA数量就是(3*5*2-2)*128=3584个,并且内置了第二代光线追踪单元以及第三代张量单元。
ROG STRIX RTX 3060 O12G GAMING的显存则是来自三星,采用了6颗2GB容量的GDDR6显存,共计192位宽,12GB GDDR6显存。
供电MosFET是来自Vishay的SIC654A
供电PWM芯片有两颗都在PCB正面,分别是uP9512R跟uP9529Q。
我们再来看ROG STRIX RTX 3060 O12G GAMING的散热器细节,在重要元器件诸如MosFET、显存颗粒上都有导热贴。并且采用了入门显卡罕见的纯铜镀镍镜面设计,在散热效能以及视觉体验上都是表现极佳的。
ROG STRIX RTX 3060 O12G GAMING采用了5根热管进行散热
这里还有一个细节,为了照顾到右侧的两相供电MosFET散热,华硕专门使用了一个固定支架,上方带有导热贴,这样既可以加固显卡的结构,还能提升散热效果,是一个值得点赞的设计。
支架效果
背板里侧右下角是透RGB光设计
灯效展示
性能测试
考虑到还是有很多玩家用的是上一代的英特尔平台,还不支持PCIE 4.0,并且到了RTX 3060 这种甜点级别来说,我们更考虑实际玩家的处理器情况,所以本次测试没有无脑上最强的CPU,而是选用了Intel Core i7-10700K这款价格和性能都较为适合搭配RTX 3060 显卡的处理器,主板采用的是华硕ProArt Z490 CREATOR 10G主板,内存用两根芝奇 皇家戟 DDR4-3600 16GB组成双通道,其他部分如下,不再赘述。
测试平台
本次首发评测对比显卡包括了:刚刚发布不久的高性价比型号RTX 3060 Ti,上代的高性价比型号RTX 2060 SUPER以及Radeon RX 5700作为参考,看看RTX 3060在这些经典性价比卡之中是一个什么样的性能。
基准性能测试
我们以3DMark作为显卡基准性能测试,测试项目包括Fire Strike、Fire Strike Extreme、Fire Strike Ultra、Time Spy、Time Spy Extreme以及Port Royal六个项目。其中Fire Strike、Fire Strike Extreme、Fire Strike Ultra三个项目分别测试的是显卡在DX11游戏中的1080p分辨率、2K分辨率和4K分辨率下的性能指数,Time Spy、Time Spy Extreme两个项目则是显卡在DX12游戏中的2K分辨率和4K分辨率下的性能指数,Port Royal是测试的显卡实时光线追踪的性能指数,具体成绩见下表,表中所列成绩均为3DMark显卡单项的得分。
通过基准测试可以看到,RTX 3060在传统的跑分性能上似乎和RTX 2060 SUPER拉不开太大的差距,应该跟RTX 2070的水平差不多。RTX 3060 Ti则是因为采用了跟RTX 3070同款的GPU核心,在性能上是比RTX 3060高出很多的。并且我们也注意到RX 5700的FS系列跑分是领先RTX 3060的,但是到了TS系列跑分就被甩在了后面。
而到了代表光追性能的Port Royal里,RTX 3060凭借着更先进的第二代RT Core,拉大了自己与RTX 2060 SUPER的距离,因此从跑分上看RTX 3060在传统性能上领先RTX 2060 SUPER的幅度较小,而光追游戏中则是可以拉开较大的差距。
1080P分辨率游戏实测
传统光栅化游戏测试
传统光栅化游戏画面测试这部分均将游戏画质设置为预设里面的最高画质设置(《地铁:离去》选择Ultra画质),默认不是全屏的手动改为全屏,默认开启了垂直同步的手动关闭垂直同步,除此之外其他选项均为默认设置,均采用游戏自带的Benchmark输出结果。
我们在理论性能测试上的成绩在实际的游戏测试当中得到了印证,在传统光栅游戏上。RTX 3060略微领先了RTX 2060 SUPER以及RX 5700,但距离RTX 3060 TI还有差距,在1080P下使用RTX 3060是可以轻松达到60FPS+以上的水平,这对于1080P显示器的用户来说,无疑是一个好消息。
实时光追游戏测试
这部分所测几款游戏仍然采用预设最高画质(《地铁:离去》选择Ultra画质),光追效果选项可选的均开为“高”设置,开DLSS的测试中DLSS选项可选的均开为“性能”设置。《光明记忆》和《边境》均为独立的Benchmark测试结果。
实时光线追踪对于显卡的要求非常高,不过其带来的精美画面也是让人难以忘怀,这种逼真效果必然是接下来游戏体验提升的方向,从测试来看,借助英伟达DLSS技术,RTX 3060除了一款优化较差的《地铁》之外,其余游戏都可以轻松达到60FPS以上的帧数,说它是1080P的光追普及者真是一点也不为过。
2K分辨率游戏实测
虽然官方宣传RTX 3060主要还是面向1080P分辨率,但是我们考虑到很多用户现在已经升级到了1440P显示器,所以我又加测了2K分辨率下,这四张卡的游戏表现。
传统光栅化游戏测试
传统光栅化游戏画面测试这部分均将游戏画质设置为预设里面的最高画质设置(《地铁:离去》选择Ultra画质),默认不是全屏的手动改为全屏,默认开启了垂直同步的手动关闭垂直同步,除此之外其他选项均为默认设置,均采用游戏自带的Benchmark输出结果。
到了2K分辨率其实总体的趋势跟刚才的1080P是一样的,只不过RTX 3060 Ti的领先幅度似乎由于带宽的优势扩大了一些。总体上RTX 3060依旧能在一些大作中给到接近60帧的体验,用户如果想稳定2K 60帧以上的话,可能还是需要手动调低特效。
实时光追游戏测试
这部分所测几款游戏仍然采用预设最高画质(《地铁:离去》选择Ultra画质),光追效果选项可选的均开为“高”设置,开DLSS的测试中DLSS选项可选的均开为“性能”设置。《光明记忆》和《边境》均为独立的Benchmark测试结果。
光线追踪方面亦是如此,RTX 3060的表现均优于前代的RTX 2060 SUPER,只不过由于分辨率提升到了2K,RTX 3060已经有点吃力。看样子官方给出的适用的1080P分辨率是正确的,如果玩家想畅玩2K 光追,这个任务给交给更高一级的RTX 3060 Ti显卡。
总结一下,RTX 3060相比RTX 2060 SUPER在传统性能以及光追性能上都有一定提升,总体的游戏水平则是与RTX 2070相当。而更高级的RTX 3060 Ti显卡相比RTX 3060则是要有着很明显的领先幅度,两者虽然都同属于60系列,但在性能上的差距还是比较明显的。RTX 3060更适合1080P游戏,而RTX 3060 Ti则是可以胜任1080P 1440P两个分辨率的游戏。
温度测试:满载峰值为58℃
我们的显卡散热测试均在裸机状态(如果安装在机箱内,GPU温度会高出5℃左右)下进行测试,测试环境温度约为25℃。待机温度是开机以后记录10分钟,满载温度则是完成3DMark Fire Strike压力测试后记录下,数据通过GPU-Z的Log to File功能记录,以下为温度测试曲线。
我们可以看到ROG STRIX RTX 3060 O12G GAMING显卡的散热实力是非常惊人的,在待机时温度始终在30多度徘徊。而在满载情况下,峰值温度甚至没有达到60℃,仅为58℃。这个温度表现在今年的大火炉显卡面前可以说是非常良好了,ROG的显卡散热实力值得肯定。
功耗测试:建议550W起步
通过我们专用的显卡功耗测试仪器,可以分别精确地测量显卡PCI-E、外接电源接口瓦特数,显卡最大功耗在3DMark Fire Strike压力测试中获得,待机功耗则是在进入系统后记录1分钟取平均值。
同时在功耗方面,由于核心规模的减小,这次ROG STRIX RTX 3060 O12G GAMING的功耗控制是相当可以的,待机时绝大多数时间是维持在10W一下。而在满载时的峰值功耗为182.4W,平均值在170W左右,用户可以根据自己的CPU进行搭配电源,这里推荐大家留出一些余量,至少准备一个550W的优质电源为整个系统提供电力支持。
超频测试
我们手动把这张ROG STRIX RTX 3060 O12G GAMING的功耗上限拉到最高123%,开始尝试超频,最后得到了下面的结果。显卡核心频率+200Mhz,显存频率+500Mhz,从而使得TimeSpy分数达到了9334分。
我们看到在超频之后,跑分的提升为4%左右,提升幅度并不大。说明现阶段的显卡驱动已经能比较好的挖掘显卡潜力了,即便是小白也不会因此而不能发挥显卡实力。
总结:光线追踪全高清时代普及者
显卡迷你天梯榜 (完整显卡天梯榜)
RTX 3060的发布意味着光线追踪显卡已经成为常态化了,玩家们只需要一张RTX 3060就能畅享1080P 60帧的光线追踪游戏,应该说这是值得肯定的。这样的话NVIDIA通过连续两代RTX显卡的努力是达到了自己普及光线追踪的效果,即便是最入门的RTX 3060也可以很好的胜任全高清分辨率的光线追踪任务。ROG STRIX RTX 3060 O12G GAMING这张显卡在温度控制上让人印象深刻,可以说是不可多得的一张好卡。
但是我们同时也看到,可能是RTX 3060 Ti的性价比太高了,目前的RTX 3060距离RTX 3060 Ti还是有着非常明显的差距的。在传统光栅游戏中的表现相比RTX 2060 SUPER提升比较小。但是到了光线追踪游戏中,RTX 3060就能拉开RTX 2060 SUPER一个身位,实际的游玩体验应该与RTX 2070别无二致。
最后是价格方面,2499的起步价还是很超值的。只不过这代显卡没有公版,非公的话势必会比这个价格还要再高出一些,这样的话从纯性价比的角度看,RTX 3060 Ti还是目前性价比最高的显卡。当然了,我们也要因地制宜。如果你的使用环境就是一个1080P分辨率显示器,还想畅玩光追游戏的话,目前没有比RTX 3060更合适的选择了。
【本文由:阿里云代理 http://www.56aliyun.com 复制请保留原URL】