GeForce GTX 1080首发评测 缔造性能神话(5)

2016-05-17 21:00:00 来源:中关村在线作者:赵鑫 人气: 次阅读 575 条评论

今年被很多人认为是VR元年,酝酿了多年的VR终于呈现出井喷式增长;今年同样是GPU的爆发之年,时隔5年,28nm的GPU终于退出历史舞台,全新的14/16nm制程开始大放光彩。随着NVIDIAPascal架构和AMDPolaris显卡的大幅。...

第四代delta色彩压缩技术

  显存压缩技术对于提高显卡性能是很有帮助的。同之前的NVIDIAGPU一样,全新的GTX1080也采用了这样一种无损压缩技术。这种技术有以下几点好处:减少显存数据写入量;减少数据从显存到GPU二级缓存的数据传输量,有效增加了GPU二级缓存的容量以及降低纹理单元和帧缓存间的数据传输量。

缔造性能神话 GeForce GTX 1080首发评测
第四代delta色彩压缩技术

  显存压缩技术中最重要的一种就是“delta色彩压缩技术”,这种技术让GPU计算每一个块中像素的差异,然后将相同色彩的像素信息进行压缩,在极端状况下,压缩储存后的参考像素还不及未经压缩像素一半的大小,这无疑大大减小了数据传输量。

缔造性能神话 GeForce GTX 1080首发评测
GTX1080有效带宽可达GTX980的1.7倍

  GTX1080搭载了全新的增强型delta色彩压缩技术,可以更高效地实现2:1的压缩比,同时,全新的4:1、8:1高压缩比模式也已被GTX1080所采用,这使得显存利用率再次达到一个新高度,相当于等效提升了对应比例的显存带宽。第四代delta色彩压缩技术同上代相比能够减少20%的有效带宽,再配合上GTX1080率先使用的10Gbps速率的GDDR5X显存,最终使得其有效显存带宽是上代GTX980的1.7倍。

异步运算技术

  从传统角度上看,GPU主要承担的任务是图形渲染,系统会将待处理的工作按照指定流程传递给GPU,以便让图像能够以正确的顺序显示出来,这点对于图形渲染来说非常重要。而现如今随着GPU功能的不断挖掘以及架构的不断升级,许多计算、复制的工作也会交由GPU来做,如果仍然只有一条序列的话,渲染、计算、复制三项任务将会互相抢占,造成“交通拥堵”,运行效率自然大打折扣。因此多条序列分别处理渲染、计算、复制等工作才能大大提升GPU效率,这种技术就是异步运算技术。

  说起异步运算技术,大家可能会首先想到AMD的GCN架构,GCN的异步着色器技术让GCN架构的A卡在DX12中拥有了出色的性能表现。随着DX12时代的全面到来,NVIDIA的全新GTX1080自然也是在异步运算上狠下功夫。官方宣称,GTX1080有着完全的异构计算能力,借助异构着色器,GPU可以并行处理多任务,而非按优先级进行候选或者抢占。

缔造性能神话 GeForce GTX 1080首发评测
动态负载平衡技术

  首先为大家介绍的是Pascal架构引入的全新技术――动态负载平衡。为了让大家能够更直观地了解这项技术,我们看上面这张图:横坐标是时间,纵坐标是GPU资源分配百分比,浅绿色是图形工作量,深绿色部分是计算工作量,而灰色斜纹部分为空闲。首先看上半部分的静态平衡,如果计算工作量所需的时间比图形工作量的时间长,而两个工作需要同时完成才能进行新的工作,那么进行图形工作的GPU就会有一部分闲置出来,这就浪费了GPU的性能;接着我们看下图的动态平衡,当计算工作量先完成时,负责计算工作的GPU资源就会去帮助完成剩余的图形工作,这样就不会有闲置的GPU资源,并且大大降低了工作所需的时间,这就是Pascal的动态负载平衡技术。

缔造性能神话 GeForce GTX 1080首发评测
Pascal架构的抢占技术

  然后是有关GPU抢占的技术。了解VR的朋友们一定听说过“异步时间扭曲”技术,异步时间扭曲是指在一个线程(称为ATW线程)中进行处理,这个线程和渲染线程平行运行(异步),在每次同步之前,ATW线程根据渲染线程的最后一帧生成一个新的帧。(有关异步时间扭曲的知识请参见《小菜硬件杂谈说说VR里的异步时间扭曲》)实现异步时间扭曲需要GPU支持合理的抢占粒度,那么抢占指的是什么意思呢?所谓抢占,就是指为了使重要工作得以快速运行,GPU会选择性关闭不太重要的工作,从而提高重要工作的运行效率。Pascal架构是史上首个支持像素级抢占的GPU架构,当接收抢占请求时,Pascal的图形单元会记录下那些优先级较低的工作被中断时的位置,优先处理那些重要的工作;当抢占结束后,其余的工作从之前被中断的位置开始继续执行。

缔造性能神话 GeForce GTX 1080首发评测
抢占在VR中的应用――异步时间扭曲(ATW)技术

  Pascal的抢占不仅作用于图形工作中,在计算工作中也可以实现。线程级的抢占和像素级抢占的实现方式类似,都是停下当前优先级较低的线程块的工作,去支援优先级较高的SMs运算线程,当抢占结束后,从之前中断的地方开始继续计算工作。对于游戏来说,像素级抢占和线程级抢占相结合让Pascal架构GPU可以以极快的速度和最小的性能开销实现抢占,同时对于CUDA计算任务,Pascal也可以以最好的抢占粒度去实现抢占。

FastSync技术

  FastSync是一种替代传统垂直同步的防止画面撕裂的技术。同V-Sync不同的是,开启FastSync后,在做到防止画面撕裂的同时能够不降低显卡的性能,也就是说FastSync能够实现V-Sync开启时的流畅画面,并且有着如同未开启V-Sync一样的低延迟。从下图可以看出,FastSync的延迟仅比关闭V-Sync时的延迟多了8ms,这点差距还是十分令人满意的。最后,FastSync技术可以搭配G-Sync技术一起使用,为玩家带来更好的视觉效果。

缔造性能神话 GeForce GTX 1080首发评测
FastSync和V-Sync延迟对比

全新高带宽桥接器

  同GTX1080问世的还有NVIDIA全新设计的SLI桥接器。使用传统的桥接器进行双卡互联时只需要连接每张卡上的一根SLI金手指即可,而这种全新的桥接器需要同时连接GTX1080上的两根SLI金手指,以提高GPU之间的数据传输带宽。这个全新的SLI桥接器叫做“NewSLIHBBridge”,使用这个全新的桥接器时,GTX1080的SLI接口运行在650MHz,而传统的桥接器搭配之前的GPU只能运行在400MHz。

缔造性能神话 GeForce GTX 1080首发评测
NewSLIHBBridge

  GTX1080的全新SLI系统能够提供上代GPUSLI系统2倍的带宽,这对于4K或5K这样的高分辨率及环绕输出尤为重要。而且全新的桥接器可以实现更平滑的画面输出,在游戏中能够为玩家带来更顺畅的游戏体验。不过遗憾的是,由于全新的桥接器需要使用两根SLI金手指才能工作,因此使用NewSLIHBBridge的GTX1080只能实现双卡SLI。

GPUBoost3.0

  GPUBoost是NVIDIA推出的GPU动态提速技术,能够在TDP允许的范围内,尽可能地提高GPU运行频率,进而提升GPU工作效率。全新的GTX1080为我们带来了这个技术的最新升级版――GPUBoost3.0。GPUBoost3.0可以设置各个电压点的频率偏移。GPUBoost2.0及以前的版本只能实现固定的频率偏移,也就是说频率的提升只能呈线性的方式,提升后的频率无法达到此电压下对应的最大频率。

缔造性能神话 GeForce GTX 1080首发评测 缔造性能神话 GeForce GTX 1080首发评测
GPUBoost2.0与3.0之间的区别

  GPUBoost3.0就很好地解决了这个问题,频率偏移可以对应到单个电压点,而不是像之前的线性相关,这样就可以使得GPU的频率达到该电压下所能实现的最大值,大大提升了GPUBoost的效果。全新的GPUBoost3.0还能与超频软件相结合,让玩家可以手动调整频率偏移曲线,来达到理想的GPU频率。

您可能感兴趣的文章

相关文章