威力全开的双RV770+GDDR5配置
● 合计每秒2.4万亿次的计算能力
追忆已成为历史的3Dfx和Xaber、以及目前的GPU双雄AMD和NVIDIA,都曾在顶级产品上使用过单卡双芯方案。AMD现在成为这种思路的先锋。和推出单个复杂的GPU芯片相比,单卡双芯是相对折中的方法。在有效的并行计算技术支持下,单卡双芯能够在最短设计周期内实现性能的150%以上提升,达到接近换代档次的幅度。单卡双芯明显节省研发成本,只是在最终个体产品上往往体现的较为复杂,单体成本较高。
Radeon HD 4870 x2使用两枚运行在750MHz频率上的RV770 GPU,合计峰值计算能力高达2.4TFLOPs!创造了目前图形计算硬件的新纪录,超过NVIDIA顶级方案一倍还多。
800 vs 320的2.5倍标量着色器绝对数目提升是RV770最吸引人的地方,AMD为此这个提升付出的芯片成本是44%的晶体管数目和37%的核心表面积的增加。但在性能方面,提升的幅度已经超过了这两个数字。
以热门产品Radeon HD 4870/HD 4850出镜的RV770 GPU应该已经被读者所熟知,这款集成了9.56亿晶体管的高性能芯片采用先进的55nm工艺制造,和竞争对手相比较低的发热水平支持双芯方案不会发热功耗失控。其典型3D计算硬件配置包括800个以[(1D*5)*16]*10配置的标量着色器、和256bit的内存控制器位宽,支持DirectX 10.1 3D API。其他属性还包括内置数字音频逻辑和全硬件解码高清加速技术UVD2.0、PCI Express 2.0外部I/O和GPU节能PowerPlay技术。
● 回顾RV770架构细节
从架构上说RV770是在RV670基础上开发的加强版本,实现相对简单但达到的性能很棒。
>>着色器
R600/RV670的320个标量着色器被分成[(1D*5)*16]*4的模式,在RV770就扩展成了[(1D*5)*16]*10,直接增加了6个16联的1D*5组织,而前端的超级仲裁机构等部分基本没有发生变化。
>>纹理单元
和着色器树木比例递增的是纹理单元,RV770的纹理单元也增加到了10组,在结构上和RV670完全相同。
>>ROPs
但是在端部分,RV770虽然仍旧使用4组16个ROPs,但这些部分却得到了AMD的改良以增强抗锯齿能力。改良的关键是加倍了Z模板的采样数,标准MSAA的运行效率有希望在这项改进后提升100%性能,因此在实际3D游戏应用中也会有明显的提速。
RV770相对于RV670的底层结构变化并不算很大,增进的主要是着色器的规模,这将直接提升GPU面对着色器编程类图形及其他计算类应用程序时的性能,最主要的改善就是最新的复杂3D游戏速度。同时剧增的着色器规模用于MSAA的计算配合ROPs的改进,Radeon HD 4000系列的抗锯齿性能也得到了加强。
更多关于RV770的技术细节和单GPU性能,读者可以在《狙击NV中端的奇兵 AMD镭HD4850测试报告》中加以了解,这里不再占用篇幅重复叙述
● GDDR5提供前所未有的充沛带宽
配合超高计算能力的是Radeon HD 4870 x2上安装的2GB 3600MHz GDDR5内存芯片,GDDR5的高频率使即使256bit内存控制器的位宽前提下,仍然提供115.2GB/s的内存带宽,注意这是每个RV770和自己控制的1GB内存芯片的数字。虽然双GPU并行不能直接认为是数据加倍、能力加倍,但这样的外围支持,已经给GPU的性能发挥消除了一切瓶颈。
和GDDR3相比,GDDR5内存芯片内的预读取I/O翻番,以同样的内核频率前提下实现加倍的外部频率,当然同时也付出延迟更高的代价,但在庞大带宽支持下获得性能提升仍然是十分明显。
Radeon HD 4870 x2显卡上配置的GDDR5内存芯片来自hynix,型号为H5GQ1H24MJR。此内存芯片使用66nm工艺制造,为170pin FBGA封装,组织形式为32M*32bit=1Gbit,操作电压1.5V,标称速度不明,hynix方面声称其速度可超过5Ghz(QDR)。16枚芯片组成1GB*2容量256bit*2位宽的显卡本地内存配置。