从Cayman架构改进看下一代AMD显卡发展

中关村在线 作者:ZOL 编辑:王旭 07-08

  ● Cayman并行体系与几何端

  基于Cayman芯片的Radeon HD 6900系列显卡在2010年末发布,同时与Radeon HD 6800系列做好由高到中端的顺畅布线,直到Cayman发布的最后一刻我们才感受到了架构改进带来的特性提升,而在此之前AMD的很多方向性问题都是保密的。


从Cayman架构改进看下一代AMD显卡发展
Cayman芯片架构示意图

  首先Cayman在几何执行端做到了并行处理,这是AMD一直希望自己做到的,也是对当今GPU架构设计最具挑战性的难题。我们知道NVIDIA方面Fermi架构GF100 GPU基于图形处理团簇(翻译为GPC),每个GPC包含一个光栅引擎和四个SM单元。GPC是GF100占主导地位的高层次的硬件模块。

30亿晶体管的咆哮
Fermi架构GPC架构图

  如果按照多核心CPU的角度去分析Fermi架构GPU,所有的GPC都集成了关键的图形处理单元,它包括顶点,几何,光栅,纹理均衡设置和像素处理资源。随着ROP单元功能的不断增强,一个GPC单元可以被看作是一个配置齐全的GPU,而GF100拥有4个这样的核心。本次Cayman则拥有两个不完全的“GPC”,因为Cayman芯片的流处理器、纹理和后端部分还是没有分开。

HD6900诞生测试
并行双图形引擎

  Cayman之前的几代产品在几何性能上几乎没有遭遇到任何瓶颈,不过对于暴力放大的RV870芯片,其三角形生成和曲面细分能力已经成为重要障碍,特别是面对NVIDIA架构原生16个曲面细分单元时,AMD从顶级的HD5870到低端HD5450都仅有一个曲面细分单元,几何性能只能用频率划分高低。

  本次从架构图上分析AMD为Cayman核心放置了两个几何单元,其实这背后牵扯到极其复杂的线程管理问题,这种设计意义非凡。双图形引擎设计,不言而喻Tessellation单元将会由此设计倍增,从而更好的适应目前DirectX 11应用。当然加倍的不仅仅是Tessellation单元,在顶点、几何等计算中也会相对老核心架构有双倍提升。

从Cayman架构改进看下一代AMD显卡发展
几何端并行化更加透彻

  双几何单元打破了AMD向来坚持的单一GPU流水线套路,三角形生成能力和曲面细分能力翻倍提升,也让AMD开始走上并行化几何处理道路。其实并行化构想在Barts时代已经提出,Barts以及Cayman构架的线程管理发放机制名为Ultra Threaded Dispetch Processor,简称UTDP,整个构架体系使用2套UTDP对线程进行管理,但Cayman的努力让几何端实现了完整彻底的并行化。

三秦IT网的官方微信:更多资讯请关注:三秦IT网官方微博

图片新闻
ZOL产品报价:手机报价 笔记本报价 数码相机报价 服务器报价 MP3报价 MP4报价 投影机报价 数码摄像机报价 硬盘报价 内存报价
ZOL笔记本报价: 戴尔笔记本 联想笔记本 惠普笔记本 ThinkPad笔记本 神舟笔记本 索尼笔记本 华硕笔记本 三星笔记本 东芝笔记本 苹果笔记本
ZOL手机报价:诺基亚手机 MOTO手机 三星手机 索爱手机 多普达手机 联想手机 CECT手机 IPHONE手机 魅族手机 天语手机 LG手机
ZOL数码相机报价:佳能数码相机 索尼数码相机 三星数码相机 尼康数码相机 松下数码相机 理光数码相机 奥林巴斯数码相机 柯达数码相机