当前位置: 首页 > 市场

全球速讯:黑衣武士,暗藏锋芒——技嘉GeForce RTX 4070魔鹰OC 12G详细评测

发布时间:2023-04-15 02:55:39 来源:微型计算机

RTX 4070 Ti先于RTX 4070登场,近日NVIDIA推出的RTX 4070除了兼具Ada架构的新特性、黑科技以及第三代RT Cores、第四代Tensor Cores之外,自然在规格方面也有着一脉相承的RTX 4070 Ti的影子。此次,针对NVIDIA GeForce RTX 4070 GPU,技嘉一共推出了AORUS GeForce RTX 4070 MASTER、GeForce RTX 4070 AERO OC 12G、GeForce RTX 4070 EAGLE OC 12G、GeForce RTX 4070 GAMING OC 12G、GeForce RTX 4070 WINDFORCE OC 12G这五款产品。它们的配色与设计不一、各有侧重,因此玩家在挑选技嘉旗下的RTX 4070时,也会有更多样的选择,在装机或是打造桌面Mod时自然会更顺手。而在我们此次非公版RTX 4070评测中,技嘉方面出场的“选手”便是GeForce RTX 4070 GAMING OC 12G,对于该系列我们也曾进行过多次评测,其出色的性能以及拔尖的散热能力给我们留下了深刻的印象。闲言少叙,那么搭载着AD104核心、拥有12GB GDDR6X内存,且经过了预超频处理的技嘉GeForce RTX 4070 GAMING OC 12G( 中文名为技嘉GeForce RTX 4070魔鹰OC 12G,后文简称为技嘉RTX 4070魔鹰OC )又会为我们带来怎样的故事呢?

技嘉GeForce RTX 4070 GAMING OC 12G产品参数

核心架构:Ada Lovelace


(资料图片仅供参考)

核心代号:AD104

制程工艺:TSMC 4N定制

SM单元:46

CUDA核心数(流处理器):5888

光追核心数(RT Cores):46

AI核心数(Tensor Cores):184

核心频率:1920MHz~2565MHz

显存容量:12GB GDDR6X

显存速率:21Gbps

显存位宽:192bit

显存带宽:504GB/s

支持DLSS版本:DLSS 3

TGP:200W

建议搭配电源额定功率:700W

产品尺寸:300mm×130mm×57.6mm

首发参考价格:5199元

老生常谈:Ada架构的那些事儿

有关于Ada Lovelace的新特性与新功能,我们在每一次的NVIDIA GeForce RTX 40系列产品解析前,都会反复赘述。当然,除了有凑字数的嫌疑,确实也有帮助大家加深记忆,抑或是方便新读者们了解它的变化以及该架构为新系列显卡带来前卫提升的目的。当然,如果读者朋友们对Ada Lovelace架构以及它的新特性、新功能已经了然于胸,可自行跳过这部分的文字解析,直接来到技嘉RTX 4070魔鹰OC的体验、测试环节。

缓存暴增

Ada架构的改革在缓存部分有了较大改变。每个SM拥有128KB L1缓存,AD102总计拥有18432KB L1缓存,相比GA102的10752KB缓存增加了大约70%。在L2缓存方面,AD102目前拥有98304KB的L2缓存,相比之前GA102所拥有的6144KB大约是后者的16倍。如此巨大的缓存,将为所有GPU相关操作都带来巨大的收益,尤其是光线追踪、路径追踪等复杂的操作收益最为明显。

更强的SM

AAD102的每个SM单元包含128个CUDA内核,1个ADA第三代RT核心以及4个ADA第四代张量(Tensor)核心、4个纹理单元、256KB寄存器、128KB的L1/共享内存,和之前的产品一样,L1/共享内存也可以根据使用情况进行配置。流式多处理器具有高达 83 TFLOPS 的着色能力,吞吐量超过上一代产品 2 倍。

第三代光追核心

第三代 RT Cores 的有效光线追踪计算能力达到 191 TFLOPS,是上一代产品 2.8 倍。

第四代AI核心

新的 Tensor Cores 新增 FP8 引擎,具有高达 1.32 petaflops 的张量处理性能,超过上一代的5倍。

Shader Execution Reordering着色器执行重排序

着色器执行重排序SER可以重新调度着色器的工作排序,从而避免部分着色器在等待中浪费算力和电能,以获得更好的效率和性能。着色器执行重排序 SER 为光线追踪带来最高可达 3 倍的性能提升,整体游戏性能提升可高达 25%。

DLSS 3与OFA光流加速器

基于Ada光流加速器的DLSS 3最高可带来相对于DLSS 2达2 倍的性能提升,使 DLSS 3 能够预测场景中帧和帧之间的运动变化,使神经网络能够在保持图像质量的同时提高帧率。DLSS 3 技术支持 GeForce RTX 40 系列 GPU,它包括 3 个功能:帧生成技术、超分辨率(DLSS 2 的关键创新)和 NVIDIA Reflex。开发者只需整合 DLSS 3,即可默认支持 DLSS 2。

新一代NVIDIA编码器(NVENC)

RTX 40系高端GPU实现了双第八代NVENC编码器的配置,能够将视频导出时间至多缩短一半,并支持 AV1 编码。OBS、Blackmagic Design DaVinci Resolve、Discord 以及更多公司都已在采用 NVENC AV1 编码器。不过对RTX 4070来说,搭配的则是单个的第八代NVENC编码器和第五代NVDEC解码器。

更强的Studio性能

除了游戏性能之外,RTX 40系GPU也是用于内容创作的优秀GPU,在加速3D设计创作、视频剪辑处理和AI计算方面,都有非常不错的表现。

同时吗,专用的NVIDIA Studio Driver在顶级创意应用上经过全面测试,能够最大限度地提高可靠性,比如:

●主播可以用支持AV1的全新第八代编码器来提高现场直播质量,利用 NVIDIA Broadcast AI 特效改善麦克风和网络摄像头,并进入AI驱动的 VTubing。

●得益于RTX 40 系列的双编码器和高达2倍的AI工具性能,视频编辑的输出速度最高可提升 2倍。

●得益于第三代RT Core、SER、DLSS 3和NVIDIA Omniverse,3D 设计创作者可以在4K@60fps 下进行创作。

●Modder可以重制经典游戏,并通过RTX Remix开启RTX。

熟悉的魔鹰,科幻既视感

▲技嘉RTX 4070魔鹰OC外壳表面设计了多样的线条、分明的棱角,类似于规则电路纹理的装饰

▲RTX 4070魔鹰OC的顶部处的背光Logo除了可以点缀外观、提升颜值,还能彰显其身份

谈到正主,技嘉RTX 4070魔鹰OC就和它的兄弟们一样,在整体设计上依然延续了该系列惯有的设计特点,外观方面主要以科幻风格为主,并在配色方面以灰、黑等电竞产品常用搭配,让其耐看的同时也多了几分设计。细节方面,RTX 4070魔鹰OC的正面并非是中规中矩的,它在外壳表面设计了多样的线条、分明的棱角,类似于规则电路纹理的装饰更是突出了它的硬核风格,让人能够一眼就能感受到它来自于技嘉的设计。与此同时,RTX 4070魔鹰OC还在正面风扇处以及顶部右侧设计幻彩背光区域——正面三环灯效RGB幻彩光轮得以呈现出光彩夺目的视觉享受,顶部处的背光Logo除了可以点缀外观、提升颜值,还能彰显其身份。另外,玩家可以通过技嘉智能管家(GCC)来对其背光进行自定义或是选择与其他硬件设备达成同步。

▲技嘉RTX 4070魔鹰OC采用支持PCIe 5.0规范的ATX 3.0标准16Pin供电接口,且接口旁设计一个Bios切换开关。

▲接口方面,RTX 4070魔鹰OC配备了3DP 1.4a+1DMI 2.1的组合

▲背部与正面保持了一致的风格,且尾部设计了巨大的镂空区域,辅助散热。

作为面向中高端玩家的显卡产品,硬实的金属背板也是当下不可或缺的部件,而技嘉RTX 4070魔鹰OC的背部拥有一块表面经过阳极氧化处理的金属背板,它的细节设计就和正面装甲一样,同样设计了大面积的线路装饰。除了能够为产品提升颜值之外,还起到了稳定PCB,能够在运输和安装过程中保护显卡的组件,在使用中也能有效防止PCB弯曲,保护内部组件和电路。同时,背板尾部的缕空设计还有助于提升显卡的散热效率。

经典风之力,保证稳定性

▲90mm导流风扇表面设计了3D条纹曲线用以提升进风量

▲RTX 4070魔鹰OC的散热器内部配备了直触式铜底并搭配8根复合式热管。

每次的大型非公版显卡评测中,如果要论及谁的性能最强、外观设计更讨巧,大家都能一教高下,争奇斗艳。但论及散热方面,技嘉总是能排名前列,为何如此?自然也与技嘉旗下显卡采用的风之力三风扇散热系统息息相关——它为显卡带来了非常显著的散热效率,即便是在经OC处理的显卡产品中,也能轻松压制其火力。而技嘉RTX 4070魔鹰OC依然采用了该散热系统,只是在部分细节方面有所差异——它的正面采用三个支持3D智能启停技术、正逆转设计的90mm导流风扇。同时,风扇处设计了3D条纹曲线用以更好地引导气流,增加散热效率。风扇的轴承处则添加了纳米石墨烯润滑油,从而让其更为安静、耐用。而在技嘉RTX 4070魔鹰OC的散热器内部,大面积的铜板能够紧贴GPU和显存部分,再搭配8根复合式热管、大面积散热鳍片以及进气格栅等设计,能够为显卡内部带来足够高效的散热能力。

▲PCB板上采用8+3相供电

不仅如此,技嘉RTX 4070魔鹰OC的PCB通过全自动化制造过程,能够有效避免因人工焊接导致的焊点影响,防止玩家在自行组装时手指被划伤和握持不当造成的意外损坏。另外,其内部采用数字供电设计,能够有效降低MOSFET的工作温度,而且每个MOSFET都有提供过温保护设计和负载平衡,再加上长寿命固态电容、合金电感、2oz铜PCB与低电阻式晶体管等超耐久用料,显卡在保证高性能的同时,也能维持更长的使用寿命。

▲技嘉RTX 4070魔鹰OC搭载了拥有5888个CUDA核心的AD104-250-A1核心。

▲该显卡配备了6颗容量为2GB的美光GDDR6X显存

性能实测,轻松超越RTX 3070 Ti,DLSS 3如虎添翼

核心方面,搭载了基于Ada Lovelace架构的AD104核心,其拥有46个光追核心(RT Core)、240个AI核心(Tensor Core)以及5888个CUDA核心。其默认频率为1920MHz,bosst频率为2565MHz,较公版RTX 4070多出90MHz,纸面实力更强。同时,AD104核心周围围绕着6颗容量为2GB的美光GDDR6X显存,且其参数与RTX 4070 Ti保持一致,显存位宽为192bit,总带宽为504GB/s。就内部散热与用料来看,超规格的技嘉RTX 4070魔鹰OC应该在后续测试中拥有更出彩的发挥。按照NVIDIA的设想,RTX 4070是一颗能满足100fps+的全特效光追游戏应用的GPU,技嘉RTX 4070魔鹰OC能否胜任呢?

▲技嘉RTX 4070魔鹰OC经过了出厂预超频处理,其Boost频率达到了2565MHz,高出官方指导Boost频率2475MHz一小截。

测试平台

GPU:技嘉RTX 4070魔鹰OC、RTX 3070 FE、RTX 3070 Ti FE、RTX 2070 SUPER FE、七彩虹战斧RTX 4070 Ti(部分测试)

CPU:英特尔酷睿i9-13900K

主板:AORUS Z790 MASTER

内存:AORUS DDR5 6000 32GB

电源:鑫谷昆仑冰山1250W(ATX 3.0)

显示器:戴尔UP3218K(7680×4320@60Hz)

操作系统:Windows 11 Pro 22H2

显卡驱动:NVIDIA Game Ready Driver 531.42

GPU基准性能测试

从3DMark结果来看,技嘉RTX 4070魔鹰OC的实际成绩颇为亮眼——相比RTX 3070时,它平均有32%以上的性能提升,由于Ada Lovelace架构升级到了第三代RT Cores,在测试光追性能的Port Royal上,技嘉RTX 4070魔鹰OC相比RTX 3070的性能增幅达到了40%左右。而对比RTX 3070 Ti,在3DMark测试中,技嘉RTX 4070魔鹰OC依然保证了胜利姿态,整体性能相比RTX 3070 Ti领先24%左右。不过相对于RTX 4070 Ti,技嘉RTX 4070魔鹰OC综合成绩平均落后约22%,这也是二者的综合硬件规格差距导致的。

传统光追游戏性能测试

在传统光追游戏性能测试环节,技嘉RTX 4070魔鹰OC的表现可圈可点,尤其是在对显卡性能要求较高的1440p分辨率下,相对于RTX 3070,拥有36%以上的平均游戏性能增幅。哪怕是面对性能更强悍的RTX 3070 Ti,技嘉RTX 4070魔鹰OC与之相比也仍旧有25%左右的综合游戏帧率涨幅,尤其是在部分对显卡性能要求更高的游戏大作中,技嘉RTX 4070魔鹰OC的领先程度更为显眼。当然,在参考测试的部分游戏中,RTX 4070相比RTX 4070 Ti受限于硬件规格仍然还是有不小差距。

当我们调低画面分辨率至1080p之后,技嘉RTX 4070魔鹰OC在应对RTX 3070、RTX 3070 Ti的挑战时,同样没有出现任何压力——在我们本次测试的所有游戏中,均出现了一边倒的情况,技嘉RTX 4070魔鹰OC分别综合领先二者34%、23%以上。当然这还是仅有DLSS 2的情况下,为此我们也十分期待技嘉RTX 4070魔鹰OC开启DLSS 3之后的游戏性能表现。

DLSS 2/3对比性能测试

我们前面提到过,Ada Lovelace架构能够帮助玩家更好地体验游戏,不仅是因为它拥有更出色的光追性能,同时它还支持DLSS 3这个能让帧率质变的“黑科技”——而DLSS 3则包括光学帧生成技术、超级分辨率和 NVIDIA Reflex。特别是光学帧生成技术,能够让游戏帧率在DLSS 2的基础之上得到更高的提升,从而让原本卡顿的画面流畅无比。在DLSS 2/3对比性能测试方面,技嘉RTX 4070魔鹰OC的表现同样让人感到十分兴奋——相比起原生帧率,平均提升幅度超过130%,将画面分辨率提升至1440p之后,DLSS 3的实际帧率表现相比原生帧率的平均提升有所提高,超过了150%。

而当我们将RTX 3070 Ti纳入对比对象之后,可以发现在DLSS 3的帮助下,技嘉RTX 4070魔鹰OC与前者之间的帧率差距拉得更大,后者在1080p、1440p分辨率综合帧率涨幅放分别达到了71%、73%以上。当然,除了帧率方面的提升之外,NVIDIA Reflex的加入也是DLSS 3之中值得关注的一点,那么在开启DLSS 3之后,技嘉RTX 4070魔鹰OC的系统延迟与1%L fps又会有怎样的变化呢?

PCL、1%L fps测试

通过Frameview抓取实际测试数据,我们能够清晰地看到,技嘉RTX 4070魔鹰OC在开启DLSS 3之后,能够大幅度提升帧率、提升1%L fps的同时,进一步有效降低系统延迟,可谓一举三得。就《霍格沃茨之遗》而言,在开启DLSS 3的情况下,1440p分辨率下系统延迟从107ms降低至38ms,1%L fps从55提升至144;将画面分辨率降低到1080p之后,在开启DLSS 3的情况下,系统延迟从76ms降低至35ms,1%L fps从46提升至99。从以上数据不难看出,在DLSS 3的帮助下,玩家可以轻而易举得获得帧率与延迟方面的双重“BUFF”,从而让操作体验更舒适。

Studio创作性能测试

Ada Lovelace架构对Studio创作应用方面的优化使得NVIDIA GeForce RTX 40系显卡拥有更为出色的生产力,特别是对于那些经常花费时间进行画面渲染的用户而言,有了NVIDIA GeForce RTX 40系显卡,自然也是事半功倍,可节省不少时间。我们在这个环节采用了Davinci resolve 18、Blender Opendata、Blender 3.5、V-Ray benchmark等多款软件对技嘉RTX 4070魔鹰OC进行了深入测试,而该显卡在Studio创作应用的表现也确实没有让我们失望,在Blender Opendata的Monster、Junkshop、classroom三项测试中,技嘉RTX 4070魔鹰OC分别得到了3105、1542、1550分,而RTX 3070分别得到了1787、1107、963分,RTX 3070 Ti分别得到了1953、1202、1003分。在V-ray benchmark的GPU RTX模式与GPU CUDA模式的测试中,技嘉RTX 4070魔鹰OC分别得到了2611、1876分,而RTX 3070分别得到了1778、1419分,RTX 3070 Ti分别得到了1949、1497分。不仅如此,在应对视频转码、图像处理方面,技嘉RTX 4070魔鹰OC的综合表现同样稳压RTX 3070 Ti、RTX 3070,整体性能表现领先前一代对位产品30%以上,赢得了实至名归的全面胜利。

Stable Diffusion AI图片生成计算

AI图像生成计算并非是诞生于今日,但随着硬件水准的提高以及相关算法的优化、完善,它在最近期得到了大范围地关注,无论是资深玩家、绘图大师,还是“野生”UP主、都在其中玩得不亦乐乎。而AI绘画的原理自然也不是单纯地对多个图片的数据进行拼接,它的过程主要是通过对训练数据的学习,让AI能够理解和提取图像的基本特征、结构和样式,从而再组成新的图片, Stable-Diffusion的原理也是如此。而在使用过程中,它会根据给定的描述或关键词,尝试在新的图像中融合和组合这些特征,方便检索、模仿、生成相关的图像或图案。我们在实际使用 Stable-Diffusion进行测试时,也需要输入特定的关键词,然后等待渲染结果。从我们实际测试数据来看,显卡的效率完全盖过了处理器,哪怕是本次测试中性能最差的RTX 2070S,其渲染速率以及出片数量均碾压了目前的高端处理器。而在本次测试的诸多显卡之中,尤以拥有第四代Tensor Core且SM架构更新进化之后的RTX 4070最为出色,AI图片生成能力领先RTX 3070 Ti约25%左右,领先RTX 3070则达到了35%。

RTX VSR,清晰播放视频娱乐

除了应对游戏、创作之外,NVIDIA还在近期的驱动中为用户们带来了一个小惊喜——RTX Video Super Resolution功能(简称RTX VSR),它能够减少视频纹理损失、锐化边缘和丰富细节,从而提升画面清晰度。通过NIVIDA控制面板开启该功能之后,用户可以在支持RTX VSR功能的浏览器或播放器(目前支持VSR技术的浏览器主要是最新版的Chrome和Edge)中得以享受更清晰的视频娱乐。当然要使用RTX VSR功能,用户们还必须拥有RTX 30系以上的GPU,并得到最新驱动程序的支持。根据实际播放的视频画面来看,RTX VSR将作用于整个画面,特别是在细节处,能够起到降噪的作用,让原本糊成一团的细节得以呈现出更分明的轮廓,从而让用户感受到细节满满的视频画面。

▲在使用RTX VSR功能之前,用户需要打开NIVIDA控制面板,选择调整视频图像设置,并在其中勾选RTX视频增强选项下的“超分辨率”(框选的内容),就能在支持VSR功能的浏览器中开启RTX 视频增强。

▲通过使用RTX VSR功能,在线视频在播放时能够更好地凸显画面细节,比如截图处的框选位置,字样轮廓明显更清晰一些。左图为Chrome浏览器播放VSR增强,右图为FireFox浏览器播放原生视频。

散热、超频测试

通过加入散热测试,我们能够在探究显卡性能之余,更好地了解它们的稳定性以及最大能耗比,因此这个环节同样重要。从实际的功耗测试来看,技嘉RTX 4070魔鹰OC在实际应用中的功耗表现较前代产品确实有了很大的改善。在主要考察光追游戏性能的3DMark Port Royal测试中,技嘉RTX 4070魔鹰OC的功耗释放平均约为215W。而旨在考察DX12传统游戏的TimeSpy Extreme测试中,技嘉RTX 4070魔鹰OC的功耗释放平均约为205W,其能耗比均比RTX 3070 Ti、RTX 3070得到显著提升。而在几个游戏的实际运行功耗测试中,技嘉RTX 4070魔鹰OC的平均游戏功耗约为187W左右,在能耗比的优势上远远超过了RTX 3070 Ti和RTX 3070。

此外,我们还对技嘉RTX 4070魔鹰OC进行了实际的烤机测试,以考察其散热性能。在室温25℃的情况下,经过半小时Furmark烤机之后,技嘉RTX 4070魔鹰OC最终温度控制在61℃,在日渐炎热的当下,它的核心温度仍旧比较“清凉”,由此可见三风扇散热系统的过人之处。

▲最终,我们将技嘉RTX 4070魔鹰OC的核心bosst频率稳定至2750MHz。

▲经过超频后的技嘉RTX 4070魔鹰OC成功完成了3DMark Time spy Extreme的测试,并得到9250的显卡得分。

在散热测试完成之后,我们进一步通过技嘉智能管家(GCC)对技嘉RTX 4070魔鹰OC进行手动超频——即便是这款显卡已经经过了预超频处理,在多次尝试之后,我们仍旧将它的核心bosst频率稳定至2750MHz,较超频前多出了185MHz。同时,在这样的状态下,技嘉RTX 4070魔鹰OC成功完成3DMark Time spy Extreme的测试,且得到了9250的显卡得分,较超频之前的8805分多出了5%,对于动手能力强的玩家而言,这款显卡可玩性不错。另外,有鉴于它的功耗较公版产品高出些许,因此大家在选择电源时,最好搭配额定功率为700W的高品质电源。

小结

略有遗憾的是,NVIDIA从RTX 4070 Ti到RTX 4070,老黄的“这一刀”略微有点“下手狠”,纸面规格差距大也导致RTX 4070在性能上相比RTX 4070 Ti要逊色不少。或许这是NVIDIA吸取了上一代RTX 3070 Ti与RTX 3070之间价位差与性能差不匹配,导致二者都非常尴尬的经验而做出的调整吧。不过从价格上来看,RTX 4070的首发价格相比RTX 4070 Ti,倒也基本符合规格与性能的差距,玩家们就各取所需吧。

整体测试结果来看,技嘉RTX 4070魔鹰OC还是很好地担负起了1440p@100fps光追游戏畅玩的重任,在所有参与测试游戏的体验中,技嘉RTX 4070魔鹰OC在开启DLSS之后,基本都实现了100+fps的1440p全特效光追游戏畅玩目的。在Ada Lovelace以及它的新特性、新功能的帮助下,技嘉RTX 4070魔鹰OC在面对上代显卡产品时完全形成了碾压的态势,其性能提升非常显著,特别是在借助DLSS 3之后,哪怕对手是RTX 3070 Ti,综合帧率提升也能达到75%以上。即使在传统游戏性能上,技嘉RTX 4070魔鹰OC的性能也领先RTX 3070 Ti和RTX 3070达到了20%、30%以上。

另外需要强调的时,在能耗比方面,技嘉RTX 4070魔鹰OC也有非常显著的优化,能够爆发出更强劲的实力。不只是游戏场景,Studio创作应用以及AI制图方面,技嘉RTX 4070魔鹰OC都同样有着上代产品难以比肩的优势,完全做到了“既要还要”的多重目标。当然,就显卡本身而言,科幻的外观加之多样的背光部位还是令其具备不错的辨识度,硬派的风格也能俘获不少玩家的芳心。特别是内部豪华的用料以及表现仍旧给力的风之力散热系统,这使得技嘉RTX 4070魔鹰OC显卡成为了一位非常全面的“六边形战士”,对于大多数装机预算在万元左右的游戏玩家来说,它是一款值得你拥有的全能产品。

标签:

Copyright   2015-2022 青年质量网 版权所有  备案号:皖ICP备2022009963号-20   联系邮箱:39 60 291 42@qq.com