MCPLive > 杂志文章 > AMD R9、R7、200系列显卡全面测试

AMD R9、R7、200系列显卡全面测试

2013-12-26《微型计算机》测评室《微型计算机》2013年11月下

这是AMD自Radeon HD 2000系列以来首次改变显卡的命名规则,命名的改变让很多用户一时间都难以接受,对新产品尤其是代号为Hawaii(夏威夷)的Radeon R9 290X充满了好奇甚至是怀疑。RadeonR9、R7 200系列显卡究竟是AMD由内到外的一次显卡革命,还是换汤不换药的普通产品?本文将站在玩家的角度,对AMD该系列显卡进行全面分析和测试。究竟是以GeForce GTX 780、GTX Titan为代表的NVIDIA显卡更出色,还是以夏威夷为代表的AMD新显卡更强势?我们拭目以待。

AMD R9、R7、200系列显卡全面测试

在上一期中,本刊曾对当时尚未发布的Radeon R9、R7 200系列显卡进行了初步的预览,对R9、R7 200系列的命名规则、产品规格、产品设计思路、新加入的一些技术等基本资料进行了介绍。今天本文将更为细致地分析、测试该系列的显卡。我们先简单来梳理下AMD新产品的命名规则:商标(Radeon)+代号(R)+产品定位(从9到7甚至更低)+三位数字(第一位表示产品代次、第二位和第三位表示版本细分)

比如Radeon R9 280X是表示AMD Radeon R系列显卡面向顶级玩家的9系列,是第二代产品,具体型号为80,X是更为强调性能的Extreme的缩写。此外,三位型号数字在同一代显卡中,数字越小,性能越低。比如Radeon R7 260X,就是面向中端用户的7系列,同为第二代产品,型号为60X。60X是小于80X的,因此性能更低。相比之前的“商标名称+HD+四位数字型号”的方式,更为鲜明地突出了产品面向的用户群体,比如R9、R7的划分,这对玩家的选购有一定帮助。从今以后,AMD显卡将全面使用这个命名规则。

在此次AMD发布的Radeon R9、R7 200系列中,一共有4个型号,它们分别是代号为Hawaii的Radeon R9 290X,价格在4799元左右,竞争对手是GTX 780;代号为Tahiti的Radeon R9 280X,价格在1899~2099元,竞争对手是GTX 760;代号为Pitcairn的Radeon R9 270X(它和Radeon HD 7870的Pitcairn是完全相同的核心),价格在1399~1599元,竞争对手是GTX 660;代号为Bonaire的Radeon R7 260X(实际上是以前只出现在OEM市场的RadeonHD 779 0),价格在999~1099元,竞争对手是GTX 650 Ti。此外,R9 290X、R9 270X、Radeon R7 260X均有公版产品,而R 9280X则没有公版产品,留给下游厂商自行发挥,因此市面上的R9280X皆为非公版产品。

根据已知的消息来看,Radeon R9、R7 200系列还会有两款产品,分别是代号为Hawaii的Radeon R9 290,代号为Oland Pro的Radeon R7 240。这其中,Radeon R9 290会很快发布,而Radeon R7 240面向入门级市场,据悉这款产品目前虽然还没有太多明确的消息,但很快也会发布。

从严格意义来说,在此次AMD新发布的显卡中,只有代号为Hawaii的Radeon R9 290X采用的是全新设计的核心。Radeon R7 260X虽然没有在非OEM市场上销售过,但很早前就已经面世。至于Radeon R9 280X和RadeonR9 270X,按照一些玩家的说法,它们就属于“马甲卡”了。因为它们分别和上一代的Radeon HD 7970和Radeon HD 7870所采用的核心是完全一样的,只是新显卡的频率更高而已。

改动不大,但重要——Hawaii核心的架构分析

毫无疑问,在此次AMD的新显卡中,代号为Hawaii的Radeon R9 290X无疑是备受关注的。

在分析Hawaii的架构之前,需要说明的是,目前无论是AMD还是NVIDIA,给出的产品架构图,都是基于市场和宣传的需要而制成的,其中隐含了大量的细节信息,同时也凸显了厂商愿意向消费者披露的信息。严重一些说,这些架构图只是厂商给出的一张画而已,和芯片内部的设计、排序是有关系的,但不会完全一致,甚至大部分都不一致(当然功能模块还是都在的)。因此,普通消费者只能看看就好,并抓住其中几个关键性的内容来了解芯片设计即可。从Hawaii的架构图总体来看,可分为三个部分,下面我们一起来看看。

Hawaii的核心架构图
Hawaii的核心架构图

计算核心部分

此次在Hawaii的架构图上,AMD设计了四个Shader Engine(类似于NVIDIA的GPC),每个Shader Engine中有11个CU单元,每个CU单元有4×SIMD-16个,总计64个的Vector Unit(向量计算单元,由ALU组成),因此总计就是4×11×6 4=2816个流处理单元(ALU)。此外,每个Shader Engine单元都有自己的几何单元,也就是Geometry Processor,用于几何计算。相比上代GCN只设置了2个Geometry Processor而言,Hawaii在几何处理方面特别是曲面细分性能方面又有大幅度的提升。当然在实际游戏中是否有如此强悍的表现,还需要看游戏对曲面细分的应用程度和优化如何了。

继续深入到CU单元这一层级来看,相比之前GCN的CU单元而言,新的Hawaii的CU单元并没有大的差别。总的来看,每一个CU单元中有4个16路的SIMD计算子模块(每个SIMD模块拥有16个ALU,一共组成16路,可以处理同时并行的16个乘加指令计算),还配备了4个64KB的矢量寄存器(每个SIMD计算子模块各1个)。这4个16路的SIMD计算子模块是CU的数据执行基础。从单个CU的角度来看,1个CU在每个时钟周期内可以执行4个不同的16路矢量线程,可以称为MIMD(多指令多数据流)。而这4个矢量线程在执行时每个线程内都使用的是16路的SIMD计算子模块,因此Hawaii在底层上采用了单指令多数据流的设计方式,这和GCN是完全一致的。

总体来看的话,AMD依旧使用了SIMD阵列作为数据执行基础,但在更高一级的层面上采用了四路SIMD单元并行的设计方案。在实际数据操作中,AMD设计的线程调度器会每次派发64粒度的线程给CU单元,CU单元将其直接分配给由4个16路SIMD组成的计算单元计算,在理想的情况下一个CU单元一个周期就可以执行64粒度的线程操作。此外,AMD说明了这44个CU单元也就是2816个流处理单元都支持IEEE 2008标准,还增加了一些额外的功能,总的来说属于比较微小的改进。

不难看出,在基础架构上Hawaii和上一代GCN是基本一致的,特别是在CU单元这一层面上。只是前者的计算单元更多,性能更强大。当然,AMD在Hawaii 上的重大改进还是有的,主要是以下内容。

AMD大幅度增加了ACE模块,并引入了新的Shader Engine结构层(或许在GCN上已经存在)。这里的变化比较重要。GCN一共有32个CU单元,两个Geometry Processor,2个ACE单元。如果认为GCN上也有Shader Engine结构层的话,那么GCN会存在2个Shader Engine结构层(也可能存在4个)。在Hawaii上,情况变化了。在一个Shader Engine中,CU单元增加到了11个,每个Shader Engine的ACE单元增加至2个,Geometry Processor也是每Shader Engine配备一个(由于四个Shader Engine的存在,Geometry Processor还是增加到了4个,原来GCN为2个)。

这样就比较明确了:Hawaii大幅度增加了GPU内部线程调配的能力(大幅度增加ACE单元数量、调配能力并调整每个Shader Engine;加强几何处理能力;相应地增加了光栅单元;增加了缓存容量。从这里可以猜测一下AMD这样设计的原因:很可能AMD经过模拟测试,发现GCN的瓶颈在于线程调配的拥挤(此外还有应对未来OpenCL线程控制的问题),因此AMD干脆一口气给予Hawaii大量而充分的线程调配模块,以应对CU单元的扩充。此外,诸如缓存和光栅单元的加强,也让Hawaii有了更进一步性能提升的资本。

这样大幅度的加强性设计,终的结果就是让Hawaii在面对重负载测试时,能够有更为优秀的表现,毕竟轻负载计算GCN已经表现得很不错了。Hawaii的出现,结合近炒得火热的4K分辨率以及SSAA抗锯齿等消息,可能是AMD在硬件配合软件发展上埋下的一个伏笔。

缓存、光栅单元和内存控制器

在Tahiti发布时,AMD给出了有关GCN架构详细缓存结构的说明。在Hawaii上,目前还没有类似的信息。不过可以看出AMD没有对Hawaii的缓存结构做出调整,只是在细节和容量上有一些改进。比如原来Tahiti的768KB可读写L1/L2缓存增加至1MB,L1和L2的缓存带宽也提升到了1TB/s,无论是容量还是带宽都相比前代产品增加了33%。在结构方面,L2缓存被划分为16个64KB的区域,用于在计算中存储不同的数据。

Hawaii大幅加强了GPU内部线程调配的能力
Hawaii大幅加强了GPU内部线程调配的能力

除了缓存外,还需要关心的是Render Back Ends(缩写为RBE或者RB),也就是NVIDIA口中的ROP,即大家都知道的光栅化单元。在架构图中,光栅化单元是画入Shader Engine中,每个Shader Engine有四个RBE模块,每个RBE模块中有4个光栅化单元,这样总计就有64个光栅化单元。相比前几代高端显卡的48个光栅化单元,Hawaii这次将光栅化单元一次提升到64个,每周期可以处理64bit的像素信息,大幅度提升了GPU在高分辨率和高抗锯齿下的性能。

在内存控制器部分,Hawaii很值得一提。AMD这次为它设计了8个内存控制器模块,每个模块为64bit位宽,总计512bit位宽。上一次AMD使用512bit还是在Radeon HD 2900XT上,不过当时AMD使用的是环状总线Ring bus,这次AMD应该换成了传统的CrossBar交叉总线模式。不过比较奇怪的是,Hawaii上的512bit显存控制器并没有带来晶体管数量和核心面积的暴增(NVIDIA的GT 200也使用了512bit,晶体管数量和核心面积大幅度增加,芯片面积在600平方毫米左右,为史上大GPU)。根据AMD的说明,在Hawaii上,AMD重新设计了显存控制器,整体面积相比384bit的Tahiti显存控制器反而小了20%,终结果是总带宽增加了20%(相比Tahiti),每平方毫米显存位宽增加了50%。

在Hawaii的显存位宽数据曝光后,很多人都惊呼AMD得到了“黑科技”,采用512bit显存位宽又保持了较小的核心面积似乎是不可能同时存在的。不过AMD在Hawaii显存部分的显存频率只有区区5000MHz,相比同期NVIDIA在GTX 770等显卡上高达7000MHz的显存频率而言,AMD的新卡为什么显存频率反而降低了呢?

实际上,显存控制器之所以能上高频率,除了和搭配的显存颗粒的规格相关以外,还因为它内部需要很多缓存和缓冲区,用于临时存放没有同步的数据。这些缓存区域的设计比较耗费晶体管,但如果想显存频率高,又不得不用它们。根据一些业内消息,AMD在Hawaii上使用的是之前Radeon HD 7870 GPU上显存控制器的改进版本,HD 7870的显存频率一直徘徊在5000~5600MHz之间,且不容易超频,就和显存控制器本身的设计有关。虽然频率较低,但这种显存控制器的体积却比较小,只有高速控制器的大约一半左右。AMD经过详细的对比,分析了“高频率+较小位宽”和“较低频率+较大位宽”的优劣后,发现如果使用大位宽的话,在差不多相同的条件下,反而能获得更高的显存带宽。不仅如此,如果使用较低频率的显存颗粒,还能在成本上节省不少。因此终AMD使用了一个较低频率显存、但是位宽高达512bit的设计。

R9 290X的GPU-Z信息
R9 290X的GPU-Z信息

R9 290X在新驱动的配合下,可以允许用户更为自由地在温度、性能和功耗之间做出选择。
R9 290X在新驱动的配合下,可以允许用户更为自由地在温度、性能和功耗之间做出选择。

外围模块

外围模块部分主要是诸如VCE、UVD、DMA、PCI-E 3.0界面。其余的部分由于和之前的GCN基本相同,在这里本文详细介绍一下ACE和新加入的TureAudio模块。

ACE模块的全称是Asynchronous Compute Engines,异步计算引擎。这个模块的作用是在GPU的前端调配任务、分派线程和指令,ACE相当于任务管理员,管理着手下2816个计算员。ACE单元早出现在Cayman GPU上,后来在Tahiti GPU上被大幅度加强,Tahiti的ACE单元每周期可以调配2个请求。在Hawaii上,AMD一口气将ACE单元增加到了8个,每个ACE都可以管理多8个请求,总计每次多可以调配64个请求,还可以访问L2缓存和全局共享数据。目前AMD在Hawaii上的ACE单元和出现在PlayStation 4以及XBOX One上的ACE单元是一样的,都是每周期可以调配8个请求。

一般来说,目前PC中的音频部分都是由CPU来计算的。特别是在游戏中,CPU的负载会很重,一些比较复杂的音频计算往往会考虑到CPU负载等问题会被省掉,因此PC中目前的游戏音效表现一直都很一般。TrueAudio技术实际上是AMD在GPU中集成了一个模块,被称为TrueAudio,它是一个专门来处理声音、改善音效的数字信号处理器。AMD的TrueAudio来源是专业应用处理器厂商Cadence收购的Tensilica研发的HiFi EP DSP,AMD大概会在GPU中使用1~10个DSP单元。有了这个单元专门处理音效的话,CPU大概可以节省约10%的性能给其他应用。

功耗和频率控制

AMD在Tahiti的第二代产品RadeonHD 7970GHz上正式启用了功耗和频率联动控制的设计。不过显然Tahiti本身核心没有内置相关硬件功能组件,其相关功能是由BIOS软件控制完成。因此AMD的GPU频率控制也和人们惯常意识中的频率控制、尤其是NVIDIA和英特尔的频率控制技术有很大不同。

在NVIDIA的开普勒家族上,NVIDIA设定了一个基准的物理频率,在绝大部分情况下,GPU运行频率是不太可能低于基准物理频率的。比如GTX 680,一般运行状态下频率会高于基准的1006MHz,高可以达到1200MHz。在NVIDIA以及英特尔、AMD的CPU上,这种动态的频率调整是正向的,是以“低频到高频”为设计基础的。

但是在AMD的Radeon HD 7970GHz以及目前的R9 290X上,AMD的设计却反了过来。以R9 290X为例,AMD官方宣称这款显卡的频率“高”可至1GHz。这个“高”是什么意思呢?实际上R9 290X设计了温度和频率反向控制的机制。在温度没有达到警戒线时,显卡会运行在1GHz的高频率上以获得不错的性能,一旦温度触碰到94℃的高温警戒线,显卡会降低一个频率档次到900MHz左右,再次触碰则再次降低。经过多次反复循环,GPU会运行在一个较低、但是相对安全的温度下。比如在测试中,可观察到的低频率大约在770MHz左右。此时由于频率较低,R9 290X的性能相比在1GHz时会有较明显的下降。

Hawaii的设计和在移动处理器上使用的高温降频技术如出一辙。这种设计会使得显卡的性能和温度表现有一定相关性,很可能会出现采用第三方散热设计的非公版Hawaii显卡在没有改变PCB和BIOS设计的情况下,仅由于散热的改变使得性能更为优秀。

AMD目前在Hawaii芯片的功耗控制上也不算很成功,功耗甚至逼近规模更大的GTX Titan,当然后者的频率和电压都要低一些。再加上Hawaii 94℃的上限温度设定和反向降频的功能,显然AMD更多考虑的是性能而不是更好的功耗表现。此外,AMD开发了新的PowerTune功耗控制技术。由于在R9 290X上使用了新的PWM芯片,因此它可以更为精细地控制电压并降低电压切换时间,新的IR3567PWM芯片支持0~1.55V之间的256级电压调节并能够降低电压切换时间至10us,表现更优秀了。此外AMD还允许用户更为自由地在温度、性能和功耗之间做出选择,这些新功能已经被集成在新的催化剂用户界面中方便用户使用了。

公版Radoen R9、R7 200系列显卡图赏

表1 : Radeon R9、R7 200系列显卡规格表

AMD R9、R7、200系列显卡全面测试

首批上市的R9、R7 200系列显卡一览

迪兰R9 290X 4G

迪兰R9 290X 4G

核心频率 1030MHz

显存频率 5000MHz

显存规格 GDDR5/4GB/512bit

参考价格 4799 元  

迪兰R9 280X 酷能 3G DC

迪兰R9 280X 酷能 3G DC

核心频率 850MHz(高1000MHz)

显存频率 6000MHz

显存规格 GDDR5/3GB/384bit

参考价格 1899 元

蓝宝石R9 270X 2G GDDR5 Vapor-X OC

蓝宝石R9 270X 2G GDDR5 Vapor-X OC

核心频率 1050MHz(高1100MHz)

显存频率 5800MHz

显存规格 GDDR5/2GB/256bit

参考价格 1499 元

蓝宝石R9 290X 4G GDDR5

蓝宝石R9 290X 4G GDDR5

核心频率 高1000MHz

显存频率 5000MHz

显存规格 GDDR5/4GB/512bit

参考价格 4799 元

迪兰R7 260X 酷能 2G DC

迪兰R7 260X 酷能 2G DC

核心频率 1160MHz

显存频率 6600MHz

显存规格 GDDR5/2GB/128bit

参考价格 999 元

其他设计

Hawaii还有一些比较令人瞩目的设计。比如新加入的X DM A,使得双卡互联不再需要桥接线的参与,而完全通过PCI- E总线交流完成。对这个设计,目前没有太多相关的内容可供评价,但从数据交换的角度来看,在PCB上额外开口增加桥接接口并不会带来显著的成本上升和应用风险,反而会明显地提升GPU之间数据交换的速度。AMD也没有对这样的设计给出太多官方的消息。不过XDMA可以支持Frame Paceing帧同步技术,能够显著降低双卡帧延迟,这是一个非常积极的改进。其余的一些技术诸如Mantle API等,本刊这期已经有比较详细的介绍,读者可以翻阅这期内容进行了解。

终结GTX Titan? R9、R7 200系列显卡深度测试

如果说GTX 780是NVIDIA GT X700系列的单芯旗舰产品,并占据单芯卡皇宝座的话,那么和其同出一脉的GT XTitan就几乎已经成了一个更超然的存在。因为GTX Titan以无比强悍的规格和性能遥遥领先GTX 780和之前同为AMD单芯旗舰的HD 7970。而现在Radeon R9、R7 200系列显卡闪耀登场,单芯卡皇的宝座会易主吗?GTX Titan无敌的神话会破灭吗?这一切我们只能将希望寄托在R9290X,这款自HD 2900XT以来核心面积首度超过400平方毫米、显存位宽再次达到惊人的512bit的大核心显卡身上。是的,接下来我们将全面考验以R9 290X为代表的R9、R7 200系列显卡的真实性能。

由于此次R9、R7 200系列显卡的新品众多,我们将分别对相关产品以及它的竞品进行对比测试,参与本次测试的显卡数量达到了11款之多。例如测试R9280X,还会加入它的“前身”HD 7970以及它的直接竞争对手GTX 760显卡一共3款产品进行测试。值得一提的是,为了考察AMD新的XDMA技术的应用情况,我们还将加入R9 290X CrossFireX的测试,来看看双卡互联在不使用桥接线以后的性能究竟是一个怎样的水平?

在测试软件方面,除了3DMark系列测试软件和Unigine Heaven Benchmark 4.0等图形基准测试软件、《孤岛危机3》和《孤岛惊魂3》等发布时间不久的游戏大作以外,我们此次特别加入了《战地4》这款刚发布的游戏大作进行测试。据悉这款游戏对显卡的要求很高,相信能够进一步测试出参测显卡的真实游戏性能。

在测试设置方面,在测试R9 280X、GTX Titan、GTX 780、R9290X Cross Fire X 这四款显卡或互联系统时,考虑到它们的定位,除了在传统的1920×1080分辨率下进行测试以外,还会加入更高的2560×1440分辨率测试。至于其他显卡则仍然保持在1920×1080分辨率下测试。

R9290XVs .GTX Titan Vs.GTX 780:性能介于两者之间

首先我们来看看R9 290X与GTX Titan的对比测试。两者总体来说,各有胜负,但显然GTX Titan凭借更强悍的性能和规格优势更为明显。在图形基准测试方面,GTX Titan在3DMark 11 Extreme、Unigine Heaven Benchmark 4.0中较R9 290X的领先幅度达到了10%以上。而在对显卡的显存容量、显存位宽要求很高的3DMark Fire Strike Extreme测试中,R9 290X凭借超高的512bit位宽优势在该项测试的成绩要优于GTX Titan。

两者在游戏大作测试方面的结果和图形基准测试结果基本一致,仍然是GTXTitan占有较为明显的优势。在总共5款游戏大作中(可能是由于驱动程序的问题,我们手中这块GTX Titan无法正常运行《战地4》,因此只能比较余下5款游戏的测试成绩),R9 290X只在《战地3》一款游戏中保持对GTX Titan 15%左右的性能优势,在《孤岛惊魂3》中两者性能基本一致。至于在余下的三款游戏中,GTX Ti tan则保持了对R9 290X 12%左右的优势。例如在1920×1080、4MSAA分辨率下,GTX Titan在《失落的星球2》、《孤岛危机3》、《尘埃3》中的领先优势分别为8%、10%、10%。但值得一提的是,在这三款游戏中,《失落的星球2》、《尘埃3》属于传统的N卡优势项目。在这种情况下,R9 290X的落后幅度只有10%已属不易。

至于在R9 290X与GTX 780的对比测试方面,R9 290X凭借在流处理单元、显存位宽等规格上的优势,性能较GTX 780技高一筹。在图形基准测试中,R9 290X两胜一负。在3DMark 11中,两者的性能差距不算大,R9 290X的优势不明显。在3DMark Fire Strike Extreme测试中,R9 290X的大显存容量、高显存位宽的优势帮助它领先GTX 780 13%。但在考验显卡曲面细分能力的Unigine Heaven Benchmark测试中,虽然R9290X已经大幅增加了几何单元,加强了几何处理能力,但仍不敌一向在该项目中优势明显的N卡GTX 780。

在实际游戏中,两者杀得难分难解。R9 290X拥有明显优势的是《战地3》,领先幅度高达30%以上。而在《战地4》、《孤岛惊魂3》、《孤岛危机3》、《尘埃3》这四款游戏中,R9 290X虽然更占优势,但领先幅度都很小,甚至在一些游戏中的领先幅度不足5%。GTX 780只是在《失落的星球2》这一N卡传统优势项目中领先R9 290X。

在这里我们还想说一点关于很多国外媒体测试R9 290X的性能普遍偏高、甚至比肩GTX 780 Titan的问题,事实上这和R9 290X的频率及温度设计息息相关。前文提到了它一旦触碰到94℃的高温警戒线,显卡的核心频率会降低,进而降低游戏性能。因此AMD给了国外媒体一个名为uber的R9 290X BIOS文件(国内媒体没有这个BIOS文件),刷新了这个BIOS以后,R9 290X的性能就不再受温度的限制,会始终保持在1GHz的频率上运行,性能自然不会打折扣。因此国外媒体关于R9290X的测试数据会偏高一些。

总体而言,R9 290X比GTX 780的性能更强,但优势不足10%。而较GTX Titan而言,R9 290X的性能又落后10%左右。是的,R9 290X的性能刚好介于GTX Titan和GTX 780之间。其实稍加分析可以发现,R9 290X的性价比在顶级产品中无疑非常高。和GTX Titan相比,R9 290X的绝对性能落后前者10%,但价格却只有前者的一半左右。和GTX 780相比,R9 290X不仅性能更强,而且价格也还便宜几百元。

国外媒体在测试R9 290X时会在两个BIOS下分别测试,使用名为uber的BIOS文件的R9 290X的性能会更强。
国外媒体在测试R9 290X时会在两个BIOS下分别测试,使用名为uber的BIOS文件的R9 290X的性能会更强。

R9 290X CrossFireX在3DMark系列测试软件中的性能提升幅度较大

R9 290X CrossFireX在3DMark系列测试软件中的性能提升幅度较大
R9 290X CrossFireX在3DMark系列测试软件中的性能提升幅度较大

主要测试平台

处理器 英特尔Core i7 3960X

主板 技嘉G1.Sniper 5 X79

内存 海盗船DDR3 1600 4GB×4套装

电源 X7-1200W

操作系统 Windows7 Ultimate 64bit

驱动程序 NVIDIA 331.65;

AMD催化剂13.11 Beta5

测试看点梳理

1.GTX Titan的神话会被打破吗?

2.R9 290X的图形性能究竟如何?

3.新的互联模式,R9 290X CrossFireX能否令人满意?

4.“马甲显卡”R9 280X、270X你们还好吗?

5.规格大幅提升的R9 290X的功耗、温度是否会剧增?

6.512bit能为R9 290X带来什么?

R9 290X CrossFireX:表现不一

我们曾经在测试AMD上一代单核心旗舰显卡HD 7970时发现,它的CrossFireX效率较高,不仅在理论测试中的性能较单卡领先接近100%,在实际游戏中的优势也在70%左右。那么R9290X在加入了XDMA技术、在组建双卡互联时不再需要桥接线的参与以后,其双卡互联的性能又如何呢?

在图形基准测试中,R9 290X CrossFireX的表现比较正常,在3DMark11、新3DMark Fire Strike Extreme中性能较单卡分别领先74%和51%。而在Unigine Heaven Benchmark 4.0测试中,R9 290X Cross FireX较单卡的领先幅度高达118%,超过了双卡100%的理论提升幅度。

在实际游戏测试中,R9 290X CrossFireX的表现比较复杂,在不同游戏中的表现差距较大。首先,在《战地4》、《孤岛危机3》这两款新游戏大作中,R9 290X CrossFireX较单卡的提升幅度在70%左右,充分显示出新的交火方式对新游戏的优化还是非常到位的。其次,在《战地3》、《失落的星球2》这两款相对较老的游戏测试中,双卡系统的性能出现了严重的问题,远远不如单卡性能,显示出新交火模式仍然有不少问题。后,交火系统带来了更大的显存容量,这使得R9 290X CrossFireX在2560×1440这种超高分辨率下的性能明显比1920×1080分辨率下更强。例如在《孤岛惊魂3》1920×1080、4AA、高画质下,R9 290X CrossFireX领先单卡幅度只有27%,但在2560×1440、4AA、高画质下,R9 290X CrossFireX的优势却高达79%。与此类似的测试结果几乎出现在所有的游戏中。

R9 290X CrossFireX在部分游戏中的性能提升不明显还很可能有另一个原因,那就是前文所说的R9 290X的核心温度在达到警戒线以后,性能会下降。在双卡系统下,R9 290X的核心温度急剧上升,极有可能导致性能下降。

R9 280XVs. GTX 760 Vs.HD 7970:2000元内强显卡

R9 280X和AMD上一代旗舰HD7970相比仅仅是频率更高,理论上两者的实际性能会有一定差距,但不会很大。实际测试证明了这一点,两者在实际游戏、图形理论测试中的性能差距在8%左右。例如在3DMark 11 Extreme和《孤岛惊魂3》1920×1080、高画质测试下,R9280X分别领先HD 7970 9%和8%。

如果将两者的频率都调整至一样,它们的性能是否会一样呢?我们将R9 280X调整至HD 7970的频率(核心频率、显存频率分别为925 MHz和5500MHz)后发现,R9 280X仍然在部分游戏中稍占优势,但这种优势不明显,几乎可以忽略不计,可以认为两者在同频下的性能是一样的。

和价格相仿的GTX 760相比,R9 280X这款“上一代旗舰级显卡”的优势无疑非常明显,领先幅度高达20%以上。例如在《战地4》1920×1080、高画质下,前者领先后者40%。

R9 270X Vs.GTX 660 Vs.HD 7870:优势明显

R9 270X 和GTX 660相比,两者只在《失落的星球2》、《孤岛危机3》这两款游戏中互有胜负。在余下的测试项目中,R9 270X较GTX 660保持了绝对的优势,平均领先幅度在20%以上。例如在1920×1080、高画质下,R9 270X在《孤岛惊魂3》、《战地4》中分别领先24%和29%。

R9 270X和HD 7870的测试结果与R9 280X和HD 7970的情况非常类似,主要区别就是频率的差异,R9 270X凭借高频的优势领先HD 7870 7%左右。

R7 260X Vs.GTX 650Ti:领先15%左右

R7 260X的“前身”HD 7790并未在零售市场上发布,对很多用户来说其性能依旧神秘。从实际测试来看,虽然R7260X作为已经发布的R9、R7 200系列显卡中定位低的一款产品,但其性能不容小觑。除了在《失落的星球2》不敌竞争对手GTX 650Ti以外,R7 260X在所有测试项目中的成绩都领先前者,平均领先幅度达到了15%左右。

R9 290X的满载核心温度达到了95℃ 
R9 290X的满载核心温度达到了95℃

R9 290X在双卡互联状态下只能被FurMark识别出一块显卡
R9 290X在双卡互联状态下只能被FurMark识别出一块显卡

R9 290X功耗、温度表现:不容乐观

从测试数据和我们的了解来看,R9 290X的功耗控制和温度表现并不理想,这和AMD在大核心显卡的设计还不够成熟有关。它的待机系统功耗和满载系统功耗分别为120W和424W,前者比核心规模更大的GTX Titan还要高,后者则逼近GT XTitan。同时,该显卡的待机核心温度、满载核心温度分别为35℃和95℃——满载温度明显偏高。是的,公版R9 290X在FurMark拷机状态下的满载温度已经突破了94℃,在拷机状态下的核心频率已经降低,并非全速运行。可以设想,如果R9 290X始终以1GHz的频率运行的话,满载系统功耗还会更高。

比较奇怪的是,R9 290X在双卡互联状态下只能被FurMark识别出一块显卡,另一块R9 290X无法被识别,运行FurMark时相当于只有一块R9 290X在拷机。因此我们测试R9 290X Cross FireX的满载系统功耗以3DMark 11 Extreme测试为准,终它的待机系统功耗、满载系统功耗分别为124W和650W。

思路的转变:AMD再造大核心显卡

R9、R7 200系列显卡尽管有一些问题,甚至部分型号还被用户诟病,但是它的整体游戏性
能还是令人满意的。从其表现来看,我们认为基本达到了AMD的预期目标。

GTX Titan不再寂寞,R9 290X虽然仍然无法超越前者,但已经具备了初步的挑战能力,至少不像HD 7970那样毫无招架之力,甚至在很多测试项目中两者的性能差距已经不足10%。而相比同价位的GTX 780,R9 290X无疑综合实力更强。如果说GTX Titan的象征意义大于实际意义,NVIDIA根本就不指望它能够在民用市场上挣钱的话,那么R9 290X 4500元左右的定价无疑更显亲民。比上,R9290X已经打破了GTX Titan的不败神话;和同级别的GTX 780相比,R9 290X不仅性能更强,且价格也还不贵。

从AMD直接将R9 280X的首发价格定在2000元以内可以充分看出(R9280X的前任HD 7970的上市价格高达4299元),这次AMD是下了血本的,颇有几分壮士断腕的决心,力争在2000元以内的甜点级市场中和NVIDIA一争高下。显然,AMD这种田忌赛马的策略是比较成功的,R9 280X相比GTX 760的优势太过于明显。如果你不计较它的满载系统功耗比GTX 760高出100W左右的话,那么在2000元以内R9 280X无疑是值得购买的产品。

表2 : Radeon R9 290X及相关显卡测试成绩(游戏均运行在高画质,游戏单位为fps,参测显卡均为公版频率)

众所周知,1500元和千元级市场的竞争是非常激烈的,而这一向也是NVIDIA的优势所在。而R9 270X和R7260X虽然也不是新产品,但是它们的定价、市场定位和场策略无疑很成功,各自的游戏性能较GTX 660和GTX 650Ti的优势都很明显,分别精准打击了NVIDIA的1500元和千元级显卡产品,有望占据1500元和千元级显卡市场。

从AMD近三代产品(HD 6000系列、HD 7000系列、R9系列)来看,AMD一直在试图改变产品架构的合理性。从HD 2000系列到HD 5000系列,AMD显卡的架构设计都没有本质的变化,始终采用的是VLIW5设计,并一直试图通过增加流处理单元的规模来加强显卡的性能。但显卡的规格到了一定的程度,这种方式将遇到瓶颈。在采用Cayman核心的HD 6900系列上,AMD意识到既有的架构在DirectX 11游戏和不少应用中出现了瓶颈,一味堆砌核心规格并不能显著提升显卡的性能。于是AMD在HD 6900系列上首次作出了尝试,它将VLIW5改进到VLIW 4,去掉了一个较大的ALU.trans单元,实现了四个对等的流处理单元,计算效率得到了提升。而在HD 7000系列上,AMD则彻底革新了图形架构,采用了被誉为“革命性的GCN架构”。

但不管是HD 6000系列还是HD 7000系列,它们都属于小核心产品,显卡的核心面积都没有超过400平方毫米。一直以来,AMD奉行的都是小核心策略,好处是可以更快速地研发产品。但小核心的一些劣势在长期的发展中也暴露了出来。目前决定图形芯片的重要因素还是晶体管的数量,小核心就意味着无法使用更多的晶体管达到更高的效能。

表3 : Radeon R9 280X及相关显卡测试成绩(游戏均运行在高画质,游戏单位为fps,参测显卡均为公版频率)

于是在R9 290X上,AMD再次做出了变革,继Radeon HD 2900XT之后,首次设计了这款核心面积为438平方毫米的大核心显卡。R9 290X的出现也正式标志着AMD开始转变了战略,从一贯的小核心策略(更多的考虑是甜点级市场,而非顶级市场)开始转向了大核心策略(争夺顶级市场分额)。

大芯片的制造不但需要强大的设计能力,也需要在大体积芯片制造上有丰富的经验和积累。AMD已经有很久没有涉足大核心产品了,再加上AMD此次在R9 290X加入了大量的流处理单元、对几何单元进行了加强、改进了线程调度能力、使用了512bit显存位宽,因此我们看到R9 290X的功耗、温度表现并不是特别令人满意。特别是其核心频率的加速机制使得该显卡常常因为核心温度突破了94℃,而不得不降频运行,从而影响了游戏性能。但不管怎么说,我们看到了AMD的努力,看到了AMD近三代产品都在努力地改进图形架构,加强显卡的性能。我们非常期待AMD下一代显卡产品又会是什么样子。

当然,面对咄咄逼人的R9、R7 200系列显卡,NVIDIA已经迅速作出了反应:推出GHz版本的GTX 780以应对R9 290X的挑战,随后还会有性能更强的GTX 780Ti。究竟顶级显卡市场会如何变化,我们拭目以待。很快我们也将带来GTX 780 GHz的评测,敬请期待。

分享到:

用户评论

共有评论(2)

  • 2014.01.09 23:14
    2楼

    这文章写得太好了!赞!

    (0) (0) 回复
  • 2014.01.05 11:12
    1楼

    显卡不错,尤其是外观设计我非常喜欢,可就是买不起啊

    (0) (0) 回复

用户名:

密码: