欧易

欧易(OKX)

国内用户最喜爱的合约交易所

火币

火币(HTX )

全球知名的比特币交易所

币安

币安(Binance)

全球用户最多的交易所

双风扇袖珍精灵,原来是稀有大杀器华硕DUAL GeForce RTX 4070 12G首发测评

2023-05-17 04:24:52 1484

摘要:在1月4日,NVIDIA GeForce RTX 40系列的第三位成员——RTX 4070 Ti性能正式解禁,并以6499元的平均价位面向市场准备发售。而今天,同之前的三位前辈一样,采用NVIDIA Ada Lovelace全新架构的又一N...

在1月4日,NVIDIA GeForce RTX 40系列的第三位成员——RTX 4070 Ti性能正式解禁,并以6499元的平均价位面向市场准备发售。而今天,同之前的三位前辈一样,采用NVIDIA Ada Lovelace全新架构的又一NVIDIA GeForce RTX GPU新品——RTX 4070也正式与大家见面了,公版建议零售价则为4799元。

它同样包括第三代RT Cores与第四代Tensor Cores,以及可以让游戏帧率大幅提升的DLSS 3技术。

众多非公版本卡厂商也同期推出了自己精心打造的RTX 4070产品。今天我们就拿到了来自华硕的ASUS DUAL-RTX4070-12G(以下简称华硕RTX4070 DUAL),在紧凑的设计之下,确实精美豪华的做工和毫不妥协的超绝性能,堪称打造中小型机箱平台的又一强悍选择。

RTX 40系列GPU关键特性回顾

在之前的首发测试中,我们已经针对RTX 40系列的新特性进行了非常详细的介绍,所以就不再赘述,有兴趣的玩家可以直接查阅我们的文章进行了解。这里只列出其中的关键点和新增的部分供大家参考。

(Ada Lovelace架构解析:https://mp.weixin.qq.com/s/GVBG6oVSIOVeb8B9F0wzWg)

• 采用NVIDIA定制4N工艺的NVIDIA Ada Lovelace架构。

• 全新设计的SM多单元流处理器,可提供高达2倍的性能与能效比。

• 配备第4代Tensor Cores 和光流加速器,大幅提升了AI计算能力,为当下火热的AI应用提供了革命性的动力,同时也带来了支持帧生成、可大幅提升帧率的NVIDIA DLSS 3技术。

• 配备第3代 RT Cores,提供高达2倍的光追性能,让光追游戏的体验提升到了新的境界。

• 支持着色器执行重排序(SER),可将执行光追操作的着色器性能最高提升2倍,在《赛博朋克2077》光追Overdrive模式中,整体游戏性能最高可提升44%。

• DLSS 3技术:利用AI计算生成额外的高质量帧,巨幅提升游戏帧率,最高可以做到一倍以上的帧率提升。

• 新一代NVIDIA Studio:为3D渲染、视频编辑和直播带来极高的效率。NVIDIA Studio全套创意应用包括NVIDIA Omniverse、Broadcast、Canvas 和 RTX Remix等等。同时,NVIDIA Studio在生产力方面的生态环境是业界公认的标杆。

• AV1 Encoders:提供支持AV1的第8代NVIDIA编码器,效率比H.264高40%,为主播、直播用户与视频会议应用带来更高效、更高质量的体验。

• 新增RTX VSR技术,可通过AI技术大幅提升视频画面质量。RTX VSR 支持RTX 40 或 30 系列 GPU,并且几乎适用于Google Chrome和Microsoft Edge浏览器中所有视频内容,目前VLC播放器也首发支持了RTX VSR。

NVIDIA DLSS 3普及速度惊人

我们知道,NVIDIA DLSS 3技术是RTX 40系列GPU的独门绝技,也是玩家升级到RTX 40系列的核心价值之一。它包括 3大功能“帧生成技术”、“超分辨率(DLSS 2 的核心)”和“NVIDIA Reflex”。也就是说,开发者只需在游戏或者应用中整合DLSS 3,即可默认支持 DLSS 2。

RTX系列GPU刚推出时,只有37%的RTX20系列玩家启用光追、26%的人在游戏中启用了DLSS。而至今为止有超过400个RTX加速的游戏、应用和数以百万计的RTX玩家。目前,83%的RTX40系列玩家都启用了光追、高达79%的玩家都启用了DLSS,可见RTX技术发展势头惊人。

当下有超过280款DLSS游戏和应用已经发布,其中包括了30款DLSS 3游戏。从数据来看,在DLSS 2和DLSS 3各自发布的前6个月中,DLSS 3被采用的速度比DLSS 2快了7倍,可见业界对于NVIDIA DLSS技术的认可程度越来越高了,由此越来越多的玩家也能更快地享受到新版DLSS技术带来的流畅游戏体验。

RTX 4070硬件规格详解

规格方面,RTX 4070采用了和RTX 4070 Ti同样的AD104核心,只是有些许精简。它拥有4组GPC、23组TPC,SM单元为46个,CUDA核心数量则为5888个。此外,纹理单元、光栅单元、RT Cores、Tensor Cores和二级缓存也对应的有所缩减,因此整体芯片的规模大约为RTX 4070 Ti的76.7%。GPU频率部分,RTX 4070的最高加速频率也略低于RTX 4070 Ti。不过,RTX 4070的显存系统与RTX 4070 Ti是一样的,都是12GB/192bit/GDDR6X,带宽也同为504GB/s。

虽然和上代的两款“70”相比,RTX 4070的GPC、TPC以及RT Cores和Tensor Cores并没有数量优势,但大家不要忘了它是采用的Ada Lovelace新架构,不但RT Cores和Tensor Cores全都领先一代,还采用了全新的SM单元设计,效率方面提升非常大,而且GPU的频率也高出许多,因此综合下来性能反而大幅增加。显存规格方面也是如此,即便RTX 4070配备的是192bit显存位宽,但容量高达8倍的二级缓存和更高的显存频率带来了更高的数据交换效率提升,综合下来性能反而大幅增长,由此也更加凸显RTX 40系列高效的特性。官方给RTX 4070的性能定位是2K分辨率下提供超100FPS的电竞级高帧率游戏体验,从硬件规格来看,RTX 4070确实能够拥有这样的实力。

RTX 40系列还有一大特色就是高能效。从RTX 40开始,我们并不能简单地以显卡功率输出高低来判定其性能高低,这是因为RTX 40系列大多数时候在达到功率墙之前,就已经跑在极限频率上输出最高性能,所以从实测数据来看,RTX 40系列的游戏功率一般都会小于官方标注的整板功率值。

表格中的数据已经显示RTX 4070平均游戏功率只有186W,这只是RTX 3070 Ti的77.5%,因此它对电源、散热器的要求大大降低,不但降低了玩家的装机成本,更低的风扇噪音也提升了使用体验。由于功率的降低,显卡厂商在生产RTX 4070时可以选择使用16pin辅助供电,也可以选择单8pin辅助供电,这对于喜欢高性能ITX小卡的玩家来说是个好消息。

今天我们手中的这块华硕Dual GeForce RTX 4070 12G就是其中代表,双风扇紧凑的外形之下,潜藏着什么样的性能呢?

紧凑彪悍,“冷静”非常

华硕DUAL-RTX4070-12G是华硕针对RTX4070特性,满足小型化平台高性能平台用户需要而推出的新品。紧凑彪悍的外观之下,具有非常“冷静”的特性。

华硕RTX4070 DUAL尺寸仅为269 x 135 x 52 mm,ITX机箱也能顺利装载

在短小精悍的外形尺寸下,华硕依然在正面面板上进行了一定的线条切割设计语言布置,使得一块双风扇卡依然具有一种冷峻的风格,充满个性魅力。

通过巧妙的散热罩、散热片以及热管布局,两个轴向技术风扇可以充分利用机箱旁侧的通风口,从而实现散热效果的最大化,同时也实现了更为出色的散热性能。

华硕DUAL-RTX4070-12G采用了8pin供电接口,对于小型机箱使用的SFX电源来说兼容性更强

两个风扇采用华硕Axial-tech轴向技术

华硕DUAL-RTX4070-12G的风扇采用了较小的双滚珠轴承轴心,从而使风叶更长,风扇寿命延长两倍,同时风扇内部还采用了障碍环以增加向下的气压。为了消除不必要的噪音,当GPU温度降至55摄氏度以下且电力消耗低时,停止模式将停止所有风扇的运转,实现0噪音运转。

华硕DUAL-RTX4070-12G背面采用全铝材质背板

全铝背板增加了PCB的结构刚度,有助于防止PCB受压并保护零件和线路免受损坏。

显卡背面还设计有一条宽敞的排气口,使热空气可以朝向机箱的排气风扇逸散,而不是被再次回收到 GPU冷却单元中。

304不锈钢打造的2.55槽设计,进一步增加了显卡强度,最大化了显卡在小机箱中的安装兼容性和散热效率

接口部分,华硕DUAL-RTX4070-12G显卡提供了3个DP 1.4a接口和1个HDMI 2.1接口,轻松满足用户对于多个显示设备的连接。

通过这一系列的精妙射击,这张华硕DUAL-RTX4070-12G显卡实现了紧凑又“冷静”的外在特质,特别是它的机动“冷静”:它在P性能模式下温度可以比一般产品情况下下降15.6%,而在Q安静模式下比P性能模式又降低了9.3分贝的噪声,并拥有低负载0噪音的特性!

接下来就是大家最关心的内在性能——实战测试部分。

游戏性能测试:2K光追甜品,DLSS 3依旧威武

首先我们来看看华硕DUAL-RTX4070-12G的基本性能参数:

测试平台

处理器:Intel Core i9 13900K

内存:芝奇DDR5 6000 16GB×2

主板:华硕ROG MAXIMUS Z790 HERO

显卡:华硕DUAL-RTX4070-12G

GeForce RTX 3070 Ti Founders Edition

GeForce RTX 4070 Ti

硬盘:WD_BLACK SN850X 2TB

电源:华硕ROG雷神1000W

操作系统:Windows 11专业版22H2

基准性能

基准测试方面,在代表DX12性能的Time Spy项目中,华硕DUAL-RTX4070-12G大概比RTX 3070Ti强20%,大概是RTX 4070 Ti的77%,换代甜品王定位实锤。测试DX11性能的FireStrike Extreme项目中,RTX 4070比RTX 3070Ti强了19%,是RTX 4070 Ti的79%,表现和TimeSpy相似。DX12U API的专项测试SpeedWay中,RTX 4070相对RTX 3070 Ti的提升为20%。

光追性能方面,PortRoyal测试中,可以看出DLSS3的光追效率确实要高不少,Ada架构带来的性能提升依旧是3070Ti拍马也赶不上的。

DLSS 3的测试demo中,巨大的性能差距显示出,RTX3070Ti的8GB显存爆了,而RTX 4070的12GB显存显示出了优势。实际上在我们后续测试中,8GB显存的3070TI在很多游戏中都面临这个尴尬场面。

从基准测试来看,RTX 4070差不多比RTX 3070 Ti强20%,相当于RTX 4070 Ti 80%的水平,再次印证了NVIDIA给RTX 4070定位的超高精准度。

光栅化游戏性能

NVIDIA官方给RTX 4070的定位是2K高帧游戏体验,不过我们也加入了4K下的成绩,方便大家参考。来看看纯光栅游戏的表现。

综合来看,纯光栅游戏中,RTX 4070在2K下相对RTX 3070 Ti的提升大约为9%~38%,平均提升幅度为19%,4K下提升14%。和RTX 4070 Ti相比,2K和4K下分别是它的81%和80%,可以说定位非常精准。

光追+DLSS游戏性能

接下来是开了光追和DLSS之后的游戏测试。

总体来看,平均这些游戏的表现,在开启光追后,RTX 4070在2K下相对于RTX 3070 Ti提升在13%~29%之间,平均优势为24%;在开启DLSS2后,提升在15~34%,平均为22%。4K下相对于RTX 3070 Ti的平均提升则为19%。和RTX 4070Ti对比的话,整体表现差距为19%,非常符合官方的精准定位。

DLSS 3是RTX 40系列的独门绝技。从测试来看,总体来看,开启DLSS3后,华硕DUAL RTX 4070确实可以实现“2K百帧”光追游戏体验,可见RTX 40系列独有的光学多帧生成技术在这里的效果显著,相对上代RTX 30的DLSS 2优势非常明显。

DLSS 3除了可以大幅提升游戏帧率外,本身也包含了Reflex技术的支持,可以有效对抗图形处理延迟和输入延迟,因此综合下来可以显著降低游戏延迟,提升玩家操控的响应速度和流畅度。开启DLSS 3后,绝大多数游戏的延迟都大幅下降,流畅度提升效果非常显著。

我们用《瘟疫传说:安魂曲》对DLSS 3的画质也进行了测评。从截图细节可以看到,即便是最注重帧率的DLSS 3性能模式,其画面精度也完全不输原生4K,而它的帧率则相当于原生4K的2.5倍以上,帧生成技术为玩家提供了两全其美的游戏体验,可见DLSS 3黑科技的强大。

生产力性能测试:紧凑卡依然表现强劲

视频剪辑与3D渲染

SPECView包含了大量的工业软件测试项目,在2020V3.1版本中,华硕DUAL RTX 4070相对于RTX 3070 Ti的提升还是很明显的。

Blender Benchmark 3.3中,RTX 4070对比RTX 3070 Ti提升也很明显,其中monster和classroom的性能是RTX 3070 Ti的1.6倍和1.5倍左右,junkshop则是有23%的提升。

RTX 4070在V-Ray中无论是使用RTX还是CUDA相对于RTX 3070 Ti都能实现20%以上的渲染效率提升,使用RTX的提升会更大一些。而OC渲染器中的性能提升最高接近40%。由于RTX 4070有12GB显存,所以其3D渲染类生产力表现比8GB的RTX 3070 Ti好不少。

视频剪辑方面,从Premiere Pro 2023来看,这张华硕DUAL RTX 4070也是强过RTX 3070 Ti的。而编码输出方面,RTX 4070新版编码器效率不错,支持AV1,而且H.265编码速度也相对RTX 3070 Ti有明显的速度提升。

从我们录制的《赛博朋克2077》游戏视频截图对比(都为4K/60fps/10Mbps码率)来看,AV1编码画质可以说是好出H.264几个档次,支持AV1硬件编码的RTX 4070在未来无疑更加值得选择。

VSR(视频超分辨率)也是最近NVIDIA为RTX 30和RTX 40系列推出的新技术,可以通过AI计算对视频实现一键升级清晰度,目前已经支持网络视频,而著名的VLC播放器新版也随RTX 4070首发支持VSR更新版本。从视频截图可以看到,开启VSR(选择“质量4”)之后,画面上的字体边缘明显锐利了很多,整体画面精度也得到了提升,效果是非常显著的,强烈推荐RTX 30和RTX 40用户开启此项功能。

AI加速内容创作

AI应用在今年突然井喷,普及速度之快令人吃惊,未来AI必将成为日常工作必须掌握的技能。我们知道NVIDIA很早就开始布局AI计算,CUDA的生态圈在业界无可匹敌,到了RTX 40时代,更是成为了AI应用的必备利器。这里我们就用Stable Diffusion来测试RTX 4070在AI出图方面的性能。出图的参数配置如图,从测试成绩可以看到,RTX 4070每分钟可以出图9张,达到了RTX 4070 Ti的85%,领先3070Ti接近三分之一。如果出图分辨率更高,对显卡显存容量的要求也会更高,这方面12GB显存的RTX 4070无疑也比8GB显存的RTX 3070 Ti更有优势。而纯CPU出图几乎没有效率可言。

功耗与温度表现:双风扇也强悍,散热轻松噪音小

从默认烤机中我们可以看出,这张双风扇卡已经能够突破标称的2505MHz核心超频频率,来到193.6W的TGP和2565MHz的核心频率水平且稳定运行,温度不到62℃,而风扇并未满载:

同时,虽然是双风扇显卡,但在华硕独特的散热体系加成下,我们通过华硕的ASUS GPU Tweak III软件,通过简单操作,也进行了简单的200/100超频测试,成功将这张卡核心频率推上了3015MHz,TGP达到了207.6W,而此时双风扇转速也达到了100%,因此GPU温度反而略低于默认烤机时:

总结:双风扇张开逆天之翼,小显卡轻松征服高性能游戏世界

基于NVIDIA定制4N工艺打造的新一代NVIDIA Ada Lovelace 架构GPU,让RTX 40系列相对上代RTX 30系带来了性能上的飞跃,而第三代RT Cores和第四代Tensor Cores也让游戏与生产力应用中的光追与AI加速提升到了一个新的水平,RTX 40系列全新加入的光流加速器,带来了DLSS3技术的AI光学多帧生成,大幅增加了游戏帧率,最终实现2~4倍的光追游戏性能提升。同时,DLSS 3的普及速度是DLSS 2的7倍(目前已经有35+的游戏支持DLSS 3),83%的RTX 40用户都在游戏中开启了光追,这也证明了这一代架构确实是史无前例的优秀,也是玩家全面进入光追+DLSS游戏时代的最佳方案。

而RTX4070很好完成了其甜品卡“顶点”定位的工作,在2K和4K分辨率下的游戏和生产力以及新兴的AI创意场景上都有极为不俗的表现。

有了以上这些光环加身,再来看华硕DUAL GeForce RTX 4070 12G,你就会更加清楚地了解到它的优势了:在市场上,近两年来几乎没有尺寸如此“娇小”而性能如此强大的双风扇消费显卡了。科学的散热设计与用料、灵活的功耗调度,使得它在“袖珍”的身材里蕴含了极为强大的性能,还能兼顾散热与噪音两方面的平衡表现。这对于追求小空间、高性能的个性化DIY玩家,尤其是ITX规格平台玩家来说,简直是一个天大喜讯,他们终于不用再将就“屈尊”,只能使用入门级显卡在1080P、非光追的低分辨率和画质世界中体验3A游戏了。而配合华硕的ASUS GPU Tweak III,我们还实现了超过其标称超频频率的性能表现,充分说明了这个“小显卡”蕴含的巨大潜力和可期未来。

袖珍又强悍,冷酷又沉默,华硕DUAL GeForce RTX 4070 12G堪称RTX4070里的低调刺客,你值得拥有。

版权声明:本站所有文章皆是来自互联网,如内容侵权可以联系我们( 微信:bisheco )删除!
友情链接
币圈社群欧易官网