● GT200芯片基础架构
这是GT200核心的透视图,每个功能区域错落有致、各司其职,具体功能如下:
GT200晶体管布局
GT200各区域职能
绿色的区域代表240个流处理器,分布在GPU的四个角;紧挨流处理器的紫色区域为纹理拾取单元,其次为黄色区域的光栅处理单元。从图中查看这三个功能单元的面积,也能了解到它们占据了绝大多数核心晶体管数量。
在从G80、GT200硬件规格上对比,G80拥有128SPs+24ROPs+32TEXs,而GT200拥有240SPs+32ROPs+80TEXs,几乎每项翻倍的规格增加也就不难理解GT200为何需要14亿晶体管来构建。
GT200核心架构示意图
240个流处理器分为10组流处理器阵列,当然每个流处理器的功能依然是能够兼职Pixel Shader、Vertex Shader和Geometry Shader,这也是DirectX 10显卡的一个特性。
每个处理阵列的结构
每个流处理器阵列中有3组流处理器,每组8个流处理器独享本地存储,每个流处理器阵列独享8个纹理拾取单元和16K的一级缓存。
在此需要说明的是,有些用户对AMD-ATI和NVIDIA的流处理器有些疑问,为何两家对位产品上A卡流处理器总是大幅领先N卡,但是实际效能却不尽人意?
抛开核心其他架构不说,NVIDIA采用SIMT技术,每个流处理器独立运行,通过提高着色器速度(异步与核心频率)来提升流处理器效能;而AMD-ATI产品的设计为5个打包运行,需要驱动仲裁分组,驱动性能会直接影响显卡性能。