Pitcairn向我们展现了一个几乎完美的GCN体系构架,同时也将Tahiti的问题一并摆在了我们的面前。相比于Tahiti,同样基于GCN体系且拥有双ACE的Pitcairn拥有高出许多的等效线程密度,单元复用率以及由此带来的相当不错的shader性能。它以小得多的规模和功耗,实现了远远超过Tahiti的性能密度和延展性。如果不是总规模限制带来的材质资源不足,HD7800的绝对性能甚至应该可以完全追上甚至超越HD7970,因此能够拥有现在这样向上压迫HD7950的表现,自然也就不足为奇了。
AMD原厂公版HD7870显卡
那么,我们的问题就来了——既然Pitcairn无论运算还是图形效率都明显要好于Tahiti,AMD为什么不以Pitcairn为基础维持比例对其进行放大,而是弄出了Tahiti这样一个存在效率问题,无论等效线程密度还是等效缓冲密度都不出众的旗舰级构架呢?今天这样的测试结果我们可以收集到,AMD性能实验室同样也可以收集到而且应该做的更好,我们甚至敢断言它们在构架凝固之前的模拟阶段就应该已经获得了与我们测试类似的结果,但它们却为何没有对Tahiti构架提出任何有效的预警或者干预呢?
对HPC市场的渴望,D线,胜利工程,这三者以及更多其它问题的共同作用,导致了今天我们所见到的Tahiti的状态。
多事之秋的AMD
基于GPGPU应用的HPC市场一直是AMD可望而不可及的,无论R600、R700、Evengreen还是Cayman,它们身上都有太多不适合HPC应用的构架级问题。因此在Tahiti研制之初,AMD便致力于修补来自通用计算性能和效率层面的诸多既往设计缺陷。但这种认知依旧没有脱离AMD对原教旨GPGPU理解的失当。AMD对HPC市场较为敏感的双精度参数的盲从,将Tahiti拖入了晶体管消耗的漩涡之中。在D线的压力下,AMD手上能够支配的芯片面积以及晶体管数量并不富裕,这部分晶体管还要被拿来满足更倾向于宣传的DP吞吐数据,这直接导致了Tahiti构架没有了可以用来扩充缓冲资源以及ACE等线程密度和并行度相关的资本,进而造就了如今HD7900尤其是HD7970那无法令人满意的单元复用率和绝对性能。
具体来说,如果维持双ACE以及目前的缓冲密度不变,Tahiti完全可以以1536个Vector ALU的规模来换取更好的线程和缓冲密度,但这并不利于平衡吞吐尤其是DP吞吐与频率/良率之间的关系,D线的横亘又让AMD失去了在维持2048 Vector ALU以及1/4 DP性能目标的前提下实现四ACE并行以及使用更大容量缓冲的可能。所以,Tahiti只得在构架上选择优先达成吞吐目标,进而也就只得接受较低的线程密度以及并不令人满意的单元复用率了。
罗瑞德带来的胜利工程目前还未给AMD带来“胜利”
在此基础上,AMD性能实验室并未对其所面对的各种搭配失当的问题作出必要的预警和干预,由于罗瑞德主推的胜利工程,包括Godfrey Cheng(All In Wonder显卡之父,AMD性能实验室主管)在内的诸多高管以及员工的离职影响了AMD性能实验室的运作,这使得了AMD的构架决策团队失去了重要的参考依据。于是,我们所见到的Tahiti也就成了今天的样子,充满了改进以及对未来的美好憧憬,但却带来了更多全新的麻烦和错误……
Wicked Game可以被翻译成带有“暧昧”意味的危险游戏,用这个词来形容Tahiti以及目前正在热切宣传本质上其实并不出众通用计算能力的AMD,应该是比较恰当的。Tahiti的图形性能以及运算性能都没有想象中那样优秀,无论对于HPC市场还是民用显示市场来说,其并不算高的单元复用率以及效率都让AMD目前的宣传和运作有了成为双刃剑的可能。
但愿未来的海岛系列构架能够弥补Tahiti上的缺憾
对于底层构架乃至公司运作过程的剖析看似与常规用户非常遥远,但正是这种剖析为我们提供了更多寻找优秀的或者更加适合我们的显卡产品的依据。以目前的情况来看,HD7800显然对大多数人来说都是更值得选择的产品。Pitcairn提供的优秀基础令其拥有了GCN体系中最佳的性能密度和效率,它的性价比、性能规模比以及性能功耗比均远高于HD7900系列,其默认绝对性能更是可以对HD7950造成极大的压迫。不管这种压迫因何而起,从产品的角度出发来看,HD7800都是一款更优秀的显卡。我们期待AMD能够尽快将HD7800的售价调整到适宜它的位置,这不仅对消费者更加有利,同时也可以带来更好的芯片出货量,是一个双赢的优秀选择。
原文出自:http://vga.zol.com.cn/284/2844709.html
三秦IT网的官方微信:更多资讯请关注:三秦IT网官方微博