2013年的显卡发展绝对可以用波澜起伏来形容,在AMD全新R9、R7系列显卡发布前,NVIDIA凭借GTX 700系列显卡在市场端一直占据着优势。但随着具有创新设计的R 200系列的发布,显卡市场也在发生着巨大的变化。那么在2013年究竟有哪些值得一提的创新技术和产品呢?
在NVIDIA方面, GTX 700和上一代GTX 600系列一样,采用的都是开普勒架构。因此两个系列在图形架构方面是一致的,前者相比后者在图性架构和技术上并没有本质的区别,GTX 700系列的主要提升在于核心规格的增加,例如GTX 680具备8个SMX(1个SMX 拥有192个流处理单元)和1536个流处理单元,GTX 780则具备12组SMX和2304个流处理单元。
目前整个GTX 700系列一共有GTX 780Ti、GTX Titan(按照NVIDIA的命名和期望,它并不属于GTX 700系列,但其采用GK110核心,属于典型的开普勒架构的产品,这里仍然姑且将其算作GTX 700系列)、GTX 780GHz、GTX 780、GTX 770、GTX 760这6款产品。这其中,GTX 780GHz、GTX 780Ti是NVIDIA今年年底为了应对R9 290X的挑战才发布的。在这之前,GTX Titan地位超然。它不仅一度是单芯卡皇,游戏性能强悍,且高性能计算能力也非常出色(完美支持双精度运算),因此价格高达8000元以上。GTX 780紧随其后,领衔GTX 700系列,是GTX 700系列早的单芯旗舰产品。而GTX 770则是次旗舰产品,核心规格和上一代旗舰产品GTX 680完全一样。GTX 760则定位在1799元~1999元,属于高性能的甜点级产品。尽管GTX700系列相比GTX 600系列在图形架构上并没有什么改进,但其引入的几项技术还是颇为值得一提的。
NVIDIA在GTX Titan中加入了一个新的功能,名字就叫“显示设备超频”。目前的液晶显示器的刷新率大部分都是59Hz或者60Hz,也就是说液晶显示器会在一秒钟内,使用静态刷新的方法,对显示器画面上的内容进行刷新。GPU的垂直同步功能也会将频率锁定在60Hz进行画面输出。这种刷新率在普通应用中是完全够用的,但在一些激烈的FPS游戏中,60Hz很可能会影响玩家成绩。该技术可以在一定程度上缓解这个问题。在显卡连接显示器输出的时候,GPU会自动检测显示器的EDID(ExtendedDisplay Identification Data,扩展识别数据)信息——所谓EDID信息,是指显示器厂商在显示器内部的存储芯片中写入的显示器硬件部分的支持情况,其中包含了分辨率、刷新率等重要参数,还有色彩支持情况等不常用的内容,EDID信息就是显示器的“身份证”。GPU在侦测到显示器有关刷新率的内容后,如果显示器硬件大支持的刷新率超过60Hz,那么GPU会自动提高GPU的硬件刷新率。在打开垂直同步的情况下,GPU会自动使用更高帧率刷新输出,并要求显示器使用更高的硬件刷新帧率,这样就可以让玩家得到更流畅的游戏体验。
在GTX 600系列显卡上,NVIDIA首度引入了GPU Boost技术,被称之为GPU Boost 1.0。GPU Boost作为一种显卡自动超频技术,其设计的目的就是为了在严格控制功耗的基础上更好地提高显卡的性能,进而提高显卡的能耗比。GPU Boost的实现在硬件上需要借助一个起着监测与控制功率作用的I2C芯片,在软件上则主要是显卡BIOS的支持。这个芯片担负着监测并控制显卡输入功率和输出功率的作用。在GPU Boost 1.0版本中,功率是重要的触发指标。GPU Boost 2.0由1.0版本改进而来,除了沿用GPUBoost 1.0中的功率触发机制外,还加入了温度触发机制。NVIDIA除了上述在产品和技术方面的新设计以外,CUDA和PhysX也得到了重要的发展,它们分别进化至 6.0和5.5版本。比如CUDA 6.0支持统一架构内存寻址,拥有大量新的并行计算库,PhysX 5.5支持新的破碎功能,可以自动生成无限可分的小碎片,带来更真实的物理效果。
AMD在2013年第四季度发布了全新的Radeon R9、R7系列,为2013年的显卡市场划下了一个圆满句号。凭借新旗舰产品R9 290X,AMD逼迫NVIDIA相关高端产品竞相降价,更加借着R9 280X等新产品在2000元以内的显卡市场对NVIDIA相关产品造成了很大威胁。特别是R9 280X,它是目前2000元左右级别的显卡中值得购买的产品。此外,新的R9、R7系列还加入了许多重要的技术,令人眼前一亮。
毫无疑问,整个Radeon R9、R7系列显卡值得关注的就是代号为Hawaii的R9 290X和R9 290这两款产品。虽然它们的图形架构也是源自上一代HD 7900系列使用的GCN架构,但在许多关键的部件上做出了大的改进,有效地提升了性能。
在底层的CU单元层面,Hawaii和Tahiti完全一致,前者的主要提升在于大幅度增加了GPU内部线程调配的能力(大幅度增加ACE单元数量、调配能力并调整每个Shader Engine)和CU单元的数量;加强几何处理能力;相应地增加了光栅单元;增加了缓存容量。这样大幅度的加强性设计,终的结果就是让Hawaii在面对重负载测试时,能够有更为优秀的表现。
在缓存设计方面,Hawaii从Tahiti的768KB可读写L1/L2缓存增加至1MB,L1和L2的缓存带宽也提升到了1TB/s,无论是容量还是带宽都相比前代产品增加了33%。在结构方面,L2缓存被划分为16个64KB的区域,用于在计算中存储不同的数据。在内存控制器部分,Hawaii很值得一提。AMD这次为它设计了8个内存控制器模块,每个模块为64bit位宽,总计512bit位宽。上一次AMD使用512bit还是在Radeon HD 2900XT上,不过当时AMD使用的是环状总线Ring bus,这次AMD应该换成了传统的CrossBar交叉总线模式。
从今年开始,AMD大幅度加强了对游戏的支持力度,有越来越多的游戏加入到AMD“Gaming Evolved”计划中来,特别是一些游戏大作开始捆绑和推荐AMD显卡。那么除了游戏外,AMD还给开发人员带来了什么福利呢?在Hawaii发布之前,AMD在GPU14大会上宣布了名为“Mantle”的新技术。“Mantle”翻译过来就是“地幔”,这是AMD为自家关乎底层硬件的API起的名称。AMD希望借助于Mantle,提升游戏等应用对GPU硬件的利用程度,从而提升游戏在自家GPU上的表现。
根据AMD的说法,Mantle可以帮助AMD的GPU减少很多无谓的损失和浪费。AMD认为目前的API比如Direct X和OpenGL,由于其通用性和兼容性,对AMD GPU的一些特性支持不是很到位,这样相当于会损失部分GPU性能。而Mantle则是AMD自家开发的API,直接挂接底层硬件,能够充分地发挥AMD GPU的硬件效能。根据AMD示意图,以Tahiti显卡为例,GCN硬件之上直接就是Mantle驱动,再向上是Mantle API,然后就是应用程序了。AMD宣称Mantle可以大幅度减少由CPU导致的GPU性能损失,带来高9倍的性能增幅。
一般来说,目前PC中的音频部分都是由CPU来计算的。特别是在游戏中,CPU的负载会很重,一些比较复杂的音频计算往往会考虑到CPU负载等问题会被省掉,因此PC中目前的游戏音效表现一直都很一般。TrueAudio技术实际上是AMD在GPU中集成了一个模块,被称为TrueAudio,它是一个专门来处理声音、改善音效的数字信号处理器。AMD的TrueAudio来源是专业应用处理器厂商Cadence收购的Tensilica研发的HiFi EP DSP,AMD大概会在GPU中使用1~10个DSP单元。有了这个单元专门处理音效的话,CPU大概可以节省约10%的性能给其他应用。
Hawaii还有一些比较令人瞩目的创新设计。比如新加入的XDMA,使得双卡互联不再需要桥接线的参与,而完全通过PCI- E总线交流完成。对这个设计,目前没有太多相关的内容可供评价,但从数据交换的角度来看,在PCB上额外开口增加桥接接口并不会带来显著的成本上升和应用风险,反而会明显地提升GPU之间数据交换的速度。AMD也没有对这样的设计给出太多官方的消息。不过XDMA可以支持Frame Paceing帧同步技术,能够显著降低双卡帧延迟,这是一个非常积极的改进。
随着玩家对显卡的要求逐渐偏向个性化和差异化,一股产品创新、深挖需求、适应市场的新风悄然而起。显卡厂商这样做的根本原因是希望依靠创新提升销量,但其实也为消费者带来了更为优秀的使用体验。在2013年,很多显卡产品都有非常独特的设计,下面我们举例来说明。
在散热方面,目前显卡虽然高功耗的趋势有所缓解,但是散热设计依旧是非常令人头疼的话题。对于这一点,索泰显卡有自己的独门秘笈。索泰在散热设计上创新发展了热管挤压嵌入散热片的新加工方式,使得导热效率大幅度提高。与此类似的还有华硕的DirectCU Ⅱ设计,依靠热管直触、多根高性能热管的方式加强散热。
在供电设计方面,华硕带来了超合金供电设计,使用了优秀的数字PWM方案和华硕独家定制的用料。此外,蓝宝石的显卡供电设计也颇有特色,数字PWM、蓝宝石独特的双面贯穿式黑钻电感,在保证供电性能的同时大幅度降低了工作温度。其他品牌方面,比如索泰的跃肩式PCB和超级多相供电设计、迪兰的数字供电方案等,都是相当出色的设计。
在特别设计方面,厂商为了加强显卡的可操控性和可玩性,推出了大量的软件,比如蓝宝石的Tri-XX、华硕的GPU Tweak、微星的AfterBurner、影驰魔盘、索泰FireStorm等,都是目前玩家喜闻乐见的优秀软件。这些软件使得显卡更好玩、更有趣、操作更简单。
除此之外,诸如易除尘的散热器、显示温度的LED灯、PCB板上电压测量点、专用的超频接口、双BIOS、加压按键等设计,都为当前的显卡带来了非常多的可玩性,大大方便了玩家。
R9 280X 3G Toxic的基准频率较高,性能高出同类产品。为了在高频下保持稳定,它使用了大量创新设计。首先,该显卡采用了蓝宝石独家的双面贯穿式黑钻电感,在电感顶部设计了屋脊装的散热沟槽,使得电感在工作时可以维持在40℃的较低温度——传统的没有任何加强散热和用料的电感在工作时温度甚至高达80℃。其次,该显卡在供电电路上设计也颇为独特,其8相数字式供电设计,相比其他产品的模拟供电设计,电流控制更为精准,供电稳定性更佳。尤其值得一提的是,在元件选择上,它使用了DirectFet封装的MOSFET,散热能力更出色、高频下工作表现更优秀。第三,为了保障高频核心的有效散热,R9 280X Toxic设计了全新的Tri-X散热器,采用了业内首创的10mm高性能纯铜热管,相比目前市面上的8mm和6mm热管的导热效率有大幅度提升。后,在人性化设计上,R9 280X 3G Toxic创新地设计了UEFI和普通BIOS的双BIOS设计,并通过显卡上的按键切换让玩家可以非常简便地就获得UEFI带来的诸多新特性。对超频玩家而言,位于该显卡PCB上的温度显示LED可以方便玩家了解显卡的温度状态。总的来说,R9 280X 3G Toxic是一款贴近玩家需求、设计富含创新、功能独特、性能优异、用料出色的显卡,使用体验很不错。