● RV790 GPU的基本状况
800 vs 320的2.5倍标量着色器绝对数目提升是RV770最吸引人的地方,AMD为此这个提升付出的芯片成本是44%的晶体管数目和37%的核心表面积的增加,但在运行频率略微调低的前提下,仍然是55nm工艺制造的RV790 GPU的功耗和发热水平被控制的都很不错。
AMD RV790 GPU
RV790仍旧由台积电制造,晶体管数目9.59亿、核心表面积282平方毫米,在Radeon HD 4890的850MHz频率设定上,它仅需单槽厚度的中型散热器就可正常工作。RV790的其他特点还有内置256bit位宽的内存控制器及符合PCI Express 2.0规范的I/O接口,其着色器和整个GPU运行频率同步。
RV790也内置了符合HD Audio规格的音频逻辑,可以直接输出完整的HDMI信号。这个集成在GPU内的“声卡”支持AC3规范的Dolby Digital和DTS编码格式,支持32kHz、44.1kHz、48kHz的16bit音频流,能够满足主流高清视频回放需求,并拿到了Windows Vista Premium Logo。
● RV790 GPU的架构分析
RV790 GPU系统架构图
>>着色器
从以上的RV770核心架构图来看,它仍然基于R600/RV670的4D+1D模式1D*5基本着色器组结构,每5个标量着色器组成一个类似以前的向量着色器样式拥有自己的基本资源进行操作。
在更宏观一步,R600/RV670的320个标量着色器被分成[(1D*5)*16]*4的模式,在RV770就扩展成了[(1D*5)*16]*10,直接增加了6个16联的1D*5组织,而前端的超级仲裁机构等部分基本没有发生变化。
>>纹理单元
和着色器树木比例递增的是纹理单元,RV770的纹理单元也增加到了10组,在结构上和RV670完全相同。
>>ROPs
但是在端部分,RV770虽然仍旧使用4组16个ROPs,但这些部分却得到了AMD的改良以增强抗锯齿能力。改良的关键是加倍了Z模板的采样数,标准MSAA的运行效率有希望在这项改进后提升100%性能,因此在实际3D游戏应用中也会有明显的提速。
>>内存控制器
RV770继续使用256bit的环形总线内存控制器,最高支持1GB的本地内存容量,在性能细节和速度方面较RV670的版本的一点变化是加入显存读写缓冲区以增强数据读写命中率,此外还增加了GDDR5类型的内存芯片支持。