5月18日,NVIDIA对外发布了其最新GeForce RTX 40的中端游戏显卡 — — GeForce RTX 4060 系列,此系列显卡包括了5月23日正式解禁的NVIDIA GeForce RTX 4060 Ti 8G,以及两款均在7月才正式解禁的NVIDIA GeForce RTX 4060 Ti 16GB与NVIDIA GeForce RTX 4060。
NVIDIA GeForce RTX 4060 Ti 8G,零售报价 3,199
NVIDIA GeForce RTX 4060 Ti 16GB,零售报价 3,899
NVIDIA GeForce RTX 4060,零售报价 2,399
规格讲解
作为全新的中端游戏显卡,NVIDIA GeForce RTX 4060 Ti 8G采用了NVIDIA最新Ada Lovelace 架构核心,是目前NVIDIA最强劲的游戏显卡架构,也是近年来NVIDIA推出的每瓦性能比最为出色的架构之一。
于是我们可以看到NVIDIA GeForce RTX 4060 Ti 8G显卡身上看到采用的AD106核心,此是继AD102、AD103,以及AD104核心后的第四款Ada Lovelace架构核心。AD106的核心面积更为小巧仅为190mm?,比上代RTX 30系列最小的GA107(200mm?)更小巧些。
而小巧的核心并不代表AD106核心的性能弱,得益于TSMC 4nm工艺技术的发展与优秀Ada Lovelace架构,AD106核心有着相当不错的规格。一个完整规格的AD106核心包括了3个GPC (图形处理集群)、18个TPC (纹理处理集群)、36 个SM (流式多处理器) 、?个带有 4 个 32Bit显存控制器的 128 Bit显存位宽,以及1个NVENC和2个NVDEC。
GeForce_RTX_4060_Ti_Diagram
NVIDIA GeForce RTX 4060 Ti 8G显卡经过一轮操作之后,最终只是削减了一组TPC,与一个NVDEC,看起来还是相当不错的,起码那个大大的L2缓存子系统没有进行削减。
显卡规格参数对比,点击上图可放大
GPU Block Diagrams图或者有些朋友是看不懂的,这里我们详细地为大家进行规格对比与规格。此次推出的NVIDIA GeForce RTX 4060 Ti 8G显卡核心频率为2310MHz、Boost频率为2535MHz;显存规格为8GB/128Bit的18Gbps GDDR6显存;其TGP功耗仅为160W,FE公版为12VHPWR接口,而AIC的非公版大部分采用的是8Pin辅助供电接口。
不过从纸面的规格上来看,NVIDIA GeForce RTX 4060 Ti 8G显卡是比上代RTX 3060 Ti显卡要弱些的,至于之后其性能表现最终会是怎么样,我们就得通过一系列的性能测试才知道了。
32MB L2 大缓存
在测试前我们有必要来再讲一下RTX 40系列显卡中的L2 大缓存,毕竟直到现在有比较多的玩家还是比较担心RTX 40系列显卡显存位宽上的这个问题?最典型的例子就是,NVIDIA GeForce RTX 4060系列显卡仅为128Bit显存位宽,而上代的同定位NVIDIA GeForce RTX 3060系列显卡显存位宽分别为192Bit与256Bit,从带宽上来看的确是差别有些大,于是NVIDIA给我们详细地讲解了为何Ada Lovelace架构会是这样的显存规格。
完整的AD102核心
首先我们从之前的GPU Block Diagrams图,以及NVIDIA官方Ada Lovelace架构白皮书上可以了解到:包括最新的AD106核心,Ada Lovelace架构的每个核心每个SM单元内部构成是一致的,核心之间的区别在于不同的核心模块构成。
而每个SM单元中都配上了一个128KB的L1缓存,一个GPC集群中最可以容纳12个L1缓存 ,其次每个核心中配备上了更大的、更高速的L2缓存,这样可以最大限度地降低访问延迟。
按照NVIDIA的说话,过往的GeForce GPU由于L2缓存比较小,导致的性能与效率的相对较低。具体表现就是GPU在缓存系统交互数据的时候,较少的L2缓存会出现较多的L2“缓存未命中”(“M”标识),这样会导致大量的未命中数据需要跑到VRAM显存缓存中才能处理,这效率看着的确有点低效,也会让显存容量占用较高。
而Ada Lovelace架构采用更大的L2缓存容量后,可以实现提升更高的 L2 “缓存命中”(“H”标识),GPU只出现小概率从VRAM显存上获取数据。
当然NVIDIA这里还给出了一个比较有意思的测试是:一块是具备32 MB L2缓存的RTX 4060 Ti ,与一块特殊的仅使用2 MB L2的RTX 4060 Ti 测试版显卡进行测试(模拟上一代显卡 128 位 GPU 的 L2 缓存大小)。*PS,实现不应该是模拟4 MB L2缓存的吗?
结果自然是32 MB L2 缓存的 RTX 4060 Ti 肯定是厉害的,在各种游戏与组合基准测试中,相比仅使用2 MB L2的RTX 4060 Ti 测试版显卡平均降低的50%的显存总线流量。而这样的50% 的流量减少,NVIDIA官方比较有意思的定义为可以让GPU 能够更有效地使用其显存带宽,效率提升可达近 2 倍。于是大家可以看到RTX 4060 Ti 的288 GB/s峰值显存带宽被等于让Ampere GPU的554 GB/秒峰值显存带宽。
当然这里NVIDIA有一点是偷换了概念,从显存规格上来看,RTX 4060 Ti最大显存带宽仍是288 GB/s,这个是一样没变的。只不过在Ada Lovelace架构32MB L2大缓存加持下,RTX 40显卡有着更低的显存占用,以及低延迟的数据访问。
另外在笔者认为,RTX 40显卡这样的显存规格,与AMD的MCD设计走着不一样的路子,但最终更多的是出于成本&效率的均衡考虑。毕竟主流的16Gb Mono Die显存颗粒单颗容量就达到2GB,4颗显存即可实现8GB显存版本RTX 4060 Ti ,而8颗即组成了7月将要发布的RTX 4060 Ti 16GB。
详细的讲解,各位朋友可以直接到NVIDIA官方网址上查看到:
A Deeper Look At VRAM On GeForce RTX 40 Series Graphics Cards【英文原版https://www.nvidia.com/en-us/geforce/news/rtx-40-series-vram-video-memory-explained/】
深入了解 GeForce RTX 40 系列显卡上的显存【中文原版https://www.nvidia.cn/geforce/news/rtx-40-series-vram-video-memory-explained/】
NVIDIA GeForce RTX 4060 Ti 8G FE
此次NVIDIA GeForce RTX 4060 Ti 8G,我们仍是推行拿到了NVIDIA特定的NVIDIA GeForce RTX 4060 Ti 8G FE显卡【下述简称“RTX 4060 Ti 8G FE”】,而AIC非公显卡,只能是24号才能让大家见面了。
RTX 4060 Ti 8G FE采用了RTX 40系列FE公版的同款外观设计,同款的产品包装,设计和保护都相当好。
只不过RTX 4060 Ti 8G FE金属框架不再是采用低调的黑化处理,而是采用更突出的亮边处理,整块的色调也显得更亮。
当然经典的反向风扇设计仍是得到保留。
朋友们来看,如果不是RTX 4060 Ti 8G FE显卡设计更亮一些,真的很难区别出RTX 4060 Ti 8G FE与RTX 4070 FE两块显卡,甚至其两块卡的重量基本一样。
混合在一起你们能区别出哪块是哪块吗?省流开奖,从左往右分别是:GeForce RTX 2070 SUPER、GeForce RTX 3060 Ti FE、GeForce RTX 3070 FE、GeForce RTX 4060 Ti FE、GeForce RTX 4070 FE、GeForce RTX 3080 Ti FE、GeForce RTX 4080 FE,以及GeForce RTX 4090 FE。
至于各位朋友认为RTX 20,RTX 30还是RTX 40更好些看,那就真的各花入各眼。
RTX 4060 Ti 8G FE显卡采用了双风扇、双槽,短卡的设计,其长宽分别为244 mm与98 mm,可以兼容大部分的机箱,尤其是ITX小机箱也能安装上。
当然笔者认为RTX 40背面是更好看了,有着大大的产品LOGO,与背部反向风扇,横装在机箱中,辨识度很高。
两侧是散热鳍片排热位置
RTX 4060 Ti 8G FE显卡顶部是12VHPWR 16Pin辅助供电接口,而根据我们了解大部分的AIC非公显卡直接使用上单8Pin的设计,毕竟TDP最高也仅为180W,常用的单8Pin接口更受玩家们欢迎。
FE显卡附送了一条单8Pin转12VHPWR转换线,提升电源接口兼容性。
RTX 4060 Ti 8G FE显卡输出接口也是较为主流的DP 1.4*3+HDMI 2.1接口,按照目前显示器分辨率与刷新率发展来看,完全满足需求。
NVIDIA GeForce RTX 4060 Ti 8G FE拆解
RTX 4060 Ti 8G FE显卡的拆解方式与RTX 4070 FE显卡一样,输出接口位置有一小孔,硬物直插后,背部金属装饰板就会弹起来。
弹起来之后就可以轻松把装饰板给拆掉,无损
拆一块FE显卡需要用到三种不同规格的刀头
而里面的金属背板侧是通过6颗螺丝给固定,拆掉即可
FE公版最吸引人的就是那做工相当细致的金属框架
拆完之后的全家桶
FE显卡的散热为深度定制款,VRM供电部分都配上辅助散热模块与导热垫
包括显存与另外一些供电散热也有进行辅助散热,而据外媒测试表明,供电辅助散热是都得配上的,不然显卡会出现过热掉频的情况。
核心为纯铜底座
大面积的散热鳍片模块,既是颜值担当,也是实力的散热效能担当。
RTX 4060 Ti 8G FE显卡PCB很小巧,而由于核心面积与4颗显存占用就那些位置,看着有点空。
但是供电部分仍是比较可以的,4+1+1+1相供电设计,完全能够满足TDP仅为160W的RTX 4060 Ti 8G FE显卡供电需求。
AD106-350核心是真小巧,不过比较搞笑的是,RTX 4060 Ti 8G FE显卡与RTX 4070 FE显卡两块公版用的似乎都是测试核心,没有正式的核心编码印在GPU表面上。
1相辅助供电设计。
高品质的12VHPWER供电接口
背面也显得相当的干净,此PCB背面来看,这板型是没背部显存安放的位置了,那RTX 4060 Ti 16G FE估计会用改良款的PCB板型。
核心主控芯片MP2898,猜测这是一个最大可控制8相供电控制芯片。
UPI uP55650Q控制芯片,辅助显存供电控制
RTX 4060 Ti 8G FE显卡PCB板型:180-1G141
拆解这就完成了,我们这就装回去。
测试平台介绍
测试平台方面,我们仍然是采用桌面级最为顶尖的处理器i9-13900KS,主板配上的是ROG MAXIMUS Z790 HERO,而方面我们这里仅采用了DDR5-6000 C32的条子,下次一批首发评测我们将使用更大容量更高性能的DDR5内存条。
而为确认DLSS3功能的正确合作,我们在测试前把BIOS恢复默认设置,同样在BIOS中开启了Resize BAR(Resizable BAR)功能。
显示器方面自然是评测室专用的电竞神器——爱攻&保时捷联名 PD32M 4K144 电竞显示器,并且在NVIDIA控制面板中把G-SYNC兼容模式给打开,在WIN11系统中把图形回速技术给打开。
最后的驱动方面,我们采用的是NVIDIA-PRESS上提供的测试版本531.93_gameready_win11_win10-dch_64bit_international,同时打开GPU-Z确认参测显卡的正确参数。
理论性能测试
性能测试方面,我们先来看一下日常跑分最常用的3DMARK。与上代RTX 3060 Ti相比,RTX 4060 Ti 8GB提升最为明显的是Speed Way与Port Royal这两项着重光线追踪性能的测试项目分别是达到了11%与22%,常规的Fire Strike与Time Spy多项测试中均约有10%性能提升。当然随着分辨率与画质的提升,两者之间的性能差距是越小的,这也是为何NVIDIA定位此款显卡为1080p分辨率下高帧显卡的原因之一。
而相比同架构的老大RTX 4070 FE显卡,RTX 4060 Ti 8GB还是有不小的差距的,主要是因为核心规格的差别与显存位宽上的限制。
游戏性能测试
作为一款定位于1080p高帧数的游戏显卡,RTX 4060 Ti 8GB游戏性能还真不错,大部分的游戏帧数都能达到100FPS以上,部分要求较低的游戏甚至是达到了150 FPS以上。而相比上代RTX 3060 Ti显卡,RTX 4060 Ti 8GB在大多数的3A游戏中有着更高的流畅度,约有115%的性能领先;尤其是支持DLSS技术的游戏上领先幅度更大。
再来看一个2K分辨率的游戏表现,RTX 4060 Ti 8GB在2K游戏性能表现同样很不错,在开启DLSS技术之后,大部分的游戏运行相当的流畅。甚至一些对光线追踪技术要求较高的游戏,也能基本上在高画质、高光线追踪设定上以60 FPS游戏度运行,这已经比上代同档次的显卡要领先119%。
当然与大哥RTX 4070是有一定的差距,具体的表现与3DMARK理论性能的差距基本是一致,这里我们就不多说了,大家可以详细看看图表。
DLSS3游戏性能测试
在测试DLSS3显卡的游戏性能之前,我们还是来看一下3DMARK测试里的DLSS理论性能表现。1080p这里我们就没有做测试了我们直接用的2K和4K分辨率。在DLSS3理论性能表现上,RTX 4060 Ti 8G确实还不错,2K理论性能跑到96 FPS,而4K分辨率也能达到了60 FPS,也意味着RTX 4060 Ti有一定的2K,或者是4K游戏的能力。
DLSS3技术是RTX 40系列显卡专有的特色功能,在我们之前的多个首发中大家也都了解到,开启这功能后,对游戏流畅度是有显著的提升。
相比RTX 3060 Ti显卡开启DLSS2功能,在DLSS3功能之后的RTX 4060 Ti 8G游戏流畅度得到了巨大的提升,基本所有在3A流大任均能在超高画质+高光线追踪实现120FPS+,性能领先幅度达到了152%。
平面内容创作性能测试
常用的内容创作性能测试,我们这里选用的是PCMARK10、UL Procyon,以及PugetBench全家桶的测试程序。
从测试结果来看,PS\LR这两种平面处理,RTX 4060 Ti 8G与RTX 3060 Ti显卡表现基本是一致的。最大的提升就在于PR与达芬奇的视频处理能力上,分别是13%与15%性能的提升。这对于游戏玩家来说是个好事,既能满足游戏需求,同时还能剪个片什么的。
三维专业创作性能测试
三维专业内容,是ADA架构的RTX 40系列显卡的天下,这也意味着,若学习三维建模这种专业应用,那RTX 40系列显卡绝对是同档次显卡的最佳选择。我们先来看看具体的性能表现:RTX 4060 Ti 8G在Blender与V-RAY表现上都较为出色,领先上代产品约122%;而专业领域测试的OctaneBench与SPECviewperf 2020上均有18%与11%的性能提升。
AV1性能测试
AV1作为近年来开源免费的视频编码格式已经被广大的视频平台与上游厂商所接受,而作为中端的RTX 4060 Ti 8G显卡也同样配备上第八代的NVENC,集成了对AV1视频格式的编码解码。刚才我们在视频测试中已经说了,RTX 4060 Ti 8G其实拿来剪片也是没问题的,这里我们输出AV格式的视频同样是没有问题,只是耗时会比RTX 4070要久一些,不过AV1 8K能力却比RTX 4070要快上那么一点。至于H.265格式的视频输出,RTX 4060 Ti 8G要比RTX 3060 Ti视频处理能力要快不少呢。
显卡AI性能测试
显卡的AI性能方面,我们同样采用了RTX 4070 FE当时的那套测试工具和方法,包括达芬奇的MAGIC MASK、ON1 Resize AI,以及近期较火的图形化AI工具Stable Diffusion Automatic1111进行测试。
AI ACCELERATED MAGIC MASK与ON1 Resize AI中,RTX 4060 Ti 8G的性能表现都是可圈可点的,在处理时间上都要比RTX 3060 Ti快上一些,甚至是接近RTX 4070 FE显卡了。而AI性能方面,同一个模块与命令行,RTX 4060 Ti 8G的算力是也不错,每分钟能出6.15张图;比RTX 3060 Ti的每分钟5.47张图,还是快是一些。当然啦,RTX 4060 Ti 8G在跑AI的时候,显存占用就已经达到7596MB,也快把8GB显存给占满在,而老黄很了解大家,7月份就正式推出16GB版本的RTX 4060 Ti显卡。
GeForce RTX 4060 Ti 8G VSR性能测试
光有游戏版的DLSS还不够,现在看视频也能用DLSS,低分辨率的视频摇身一变就可提升分辨率,就问你刺不刺激!NVIDIA在上次的RTX 4070之际带来了RTX Video Super Resolution 视频超分辨率技术(RTX VSR),通过AI技术即可提高浏览器内的视频的分辨率,展现前所未有的显示效果。
今天我们也用RTX 4060 Ti 8G测试这项划时代的RTX VSR技术。使用相当简单,在RTX 30系和RTX 40系的NVIDIA控制面板中找到视频图像设置,手动开启RTX Video enhancement即可启用RTX VSR技术,其中分为1-4档调节,数字越大质量越好。
实测环节,可以看到在开启RTX VSR技术之后,原视频里的人物线条由原本的模糊不清变得十分清晰锐利,甚至部分细节已经超越原生1080P了,并且低画质的视频也有不少噪点,在开启VSR 4档后,噪点几乎消失。
除此之外,由于是AI智能提升分辨率的缘故,字体在原生的480P视频中有些发虚,甚至字体边缘可以看到毛边,不过有了VSR的加持后,字体锐利可见,完全不输原生1080P的效果,不得不说VSR确实有点东西。
这里我们也给大家准备了对比视频,从视频里就可以看到VSR的效果之明显,最高级别的VSR 4跟原生480P相比就是一眼的区别,在开启RTX VSR技术后,部分图像质量有了显著提高,不仅锯齿和噪点几乎全部消失,颜色过渡也更为平滑,目前VSR能有这种表现堪称惊艳。
左:原生480P 中:VSR 4档 右:原生1080P
当然你除了在浏览器能够使用这项功能外,本地浏览器也能享受黑科技的魅力,VLC是目前首个支持RTX VSR技术的本地播放器,且能够支持多种视频格式播放,你硬盘里的老视频也能拥有清晰画质了!
我们将本地的360P画质视频进行RTX VSR 4档渲染,从画面上看,开启了VSR技术后,右侧的渲染视频确实比左侧原生的视频要清晰许多,并且肉眼可见噪点的减少,观感上要明显好于原生的360P视频。
如果你想知道本地VSR的效果,这里也有视频可以看到二者的差距,确实能够明显看出有VSR的加持后,不少细节重新清晰可见,对一些低分辨率视频确实有提升。
左:本地原生360P 右:VSR-4档
有玩家可能担心功耗的问题,这里我们也进行了实测,在VSR开启最高档4档的情况下,RTX 4060 Ti 8G 的功耗仅有30W左右,显卡利用率也远没有网络上传的那么高。
本地播放视频开启VSR后,功耗也相当之低,并且还能带来更好的画质,因此笔者还是建议平时可以开启该功能使用。
总的来说,RTX 4060 Ti 8G上的RTX VSR技术将为玩家和视频观看者带来革命性的新体验!无论是性能上还是技术上的创新,都称得上是流媒体时代的革命!
温度与功耗对比测试
又来到大家喜欢的温度与功耗测试环节,三块测试显卡均为NVIDIA提供的FE,Founders Edition,也就是我们常说的公版显卡。RTX 4060 Ti 8G FE烤机的最大BPD功耗为159.7W,刚好控制在TGP 160W以内,而PCIe功耗仅为17.2W,主要供电来自辅助供电的12VHPWR上,达到了142.5W。而最让人高兴的是RTX 4060 Ti 8GFE烤机30分钟后的满载温度仅为63.1度,显存满载温度也仅为73.7,可以说是较为低温的表现。
我们再来拿一个较为详细的功耗测试进行对比,利用HWINFO64,以及FrameView软件进行显卡的功耗监控,得到上面三块不同显卡的功耗表现。RTX 4060 Ti 8G FE功耗控制真心的不错,大部分情况下就控制在了160W以下,甚至一些LR与AE测试仅为几十W。相比上代的RTX 3060 Ti显卡动不动就是200W的功耗来说,RTX 4060 Ti 8G FE可以说是有着超出色的功耗控制表现。
总结:1080p高帧数游戏利器
128Bit显存是否配得上RTX 4060 Ti 8G这显卡,其实NVIDIA交给了我们答案。尤其是技术层面的,32MB大容量的L2缓存可以减少GPU交互数据之间带来的延迟,增加显存的利用率。虽然对于规格按来说有些不甘,但不可否认的是128Bit显存的确会在成本控制、效率,以及性能方面达到理好的平衡。
再来说说RTX 4060 Ti 8G这显卡的性能,通杀1080p分辨率下绝大多数游戏都不是问题,相比上代显卡RTX 3060 Ti提升15%~20%的性能提升看着不多,甚至被说挤牙膏。 但是当你玩上DLSS3游戏后,你就会知道RTX 4060 Ti 8G真正意义上的性能提升就在于这里,领先RTX 3060 Ti约152%的性能已经很了不起。尤其最大TDP功耗仅为160W,仅为RTX 3060 Ti的80%功耗,性能提升却这么多,相当不错了。
再来说说流行的AI性能,RTX 4060 Ti 8G显卡的AI能力还不可以的,每分钟能输出 6.15张图,在我们之前做的多款显卡AI性能测试中已经不错的位置,十分接近RTX 3070的表现。当然8GB显存也有一定的限制性,完成512px分辨率的图片是没有问题的,但想更高更复杂的模型,那8GB也明显不太足够,未来的16GB相信会是个不错的选择。
最后说说购买方面,NVIDIA GeForce RTX 4060 Ti 8G零售报价 3,199起,部分AIC非公产品会比这个贵上几百。618急着装机,对4K游戏要求不高的用户,NVIDIA GeForce RTX 4060 Ti 8G会是不错的选择,能玩高帧数玩游戏,能做视频,能做AI,温度&功耗控制也出色,的确是逢6必火的节奏。
首测回顾:
2K 100FPS+光追显卡,NVIDIA GeForce RTX 4070 FE首发评测
//diy.pconline.com.cn/1605/16052004.html
比上代旗舰RTX 3090 Ti还猛,NVIDIA RTX 4070 Ti首发评测
//diy.pconline.com.cn/1576/15765825.html
ADA架构第二发炮弹,NVIDIA GeForce RTX 4080 FE公版首发评测
//diy.pconline.com.cn/1560/15608164.html
NVIDIA GeForce RTX 4090 FE首发评测:大杯的体积,超大杯的性能
//diy.pconline.com.cn/1548/15485084.html
横评回顾:
15张N卡AI绘图大横评!哪张才是赛博画图之王?
https://pconline.pcvideo.com.cn/video-31904.html
猛男踩坑指南第三期,有了DLSS 3后低U高显也能爽玩游戏吗?
https://pconline.pcvideo.com.cn/video-31830.html
PC硬件杂谈:NVIDIA RTX 30系列显卡内容创作性能测试
//diy.pconline.com.cn/1524/15247006.html