GT200 核心架构基础状况
● 成本高昂的GT200芯片
由于GT200核心是一款全新理念设计的产品,架构上也发生了改变,本章节将围绕核心架构设计展开,毕竟将14亿的庞大晶体管群设计在576mm2上需要非常合理的布局设计 。
G80(左)与G200(右)核心对比
拥有6.81亿晶体管的G80核心与拥有14亿晶体管的GT200核心外观设计上相同,采用类似于CPU的封装设计,外面这层“盖”既有保护核心的功能,又有增加核心表面积提高散热效果的功效。那么GT200相对G80多出一倍以上的晶体管数量,主要用于了哪方面呢?
还未切割的GT200晶圆
● GT200芯片基础架构
GT200晶体管布局
这是GT200核心的透视图,每个功能区域错落有致、各司其职,具体功能如下:
GT200各区域职能
在从G80、GT200硬件规格上对比,G80拥有128SPs+24ROPs+32TEXs,而GT200拥有240SPs+32ROPs+80TEXs,几乎每项翻倍的规格增加也就不难理解GT200为何需要14亿晶体管来构建。
GT200核心架构示意图
每个处理阵列的结构
每个流处理器阵列中有3组流处理器,每组8个流处理器独享本地存储,每个流处理器阵列独享8个纹理拾取单元和16K的一级缓存。
抛开核心其他架构不说,NVIDIA采用SIMT技术,每个流处理器独立运行,通过提高着色器速度(异步与核心频率)来提升流处理器效能;而AMD-ATI产品的设计为5个打包运行,需要驱动仲裁分组,驱动性能会直接影响显卡性能。以RV670核心为例,其拥有320个流处理器,但实际却等效为320/5=64。即使AMD-ATI还未发布的RV770核心,无论传说中的480个流处理器还是800个流处理器,即使是800个才等效160。AMD-ATI也看到这种设计的弊端,在马上释放的RV770产品中也加入了核心、Shader频率异步的设计。