重归正途迎未来 AMD全新GPU构架深度解析

中关村在线 作者:ZOL 编辑:王旭 06-23
  ● 蓝色的“芯”
  
  既然已经抛弃了VLIW,那么对ALU团簇的改进就成了摆在AMD面前的当务之急了。可是VLIW结构毕竟已经在AMD构架中使用了五代,长达近5年的时间里AMD的所有研究工作全部围绕着它来开展,现在想要推翻谈何容易。在VLIW CORE结构出现之初,AMD曾经有多次机会可以以比较小的代价完成转型,比如RV670以及RV770之后,AMD都曾经有机会利用构架改进这一契机从VLIW中抽身而出。但出于种种原因,AMD放弃了这些机会,这使得AMD在VLIW的路上越陷越深难以自拔。


重归正途迎未来 AMD全新GPU构架深度解析
R600 ALU结构

  怎么办?别急,让我们先来看一位非常熟悉的老朋友——Larrabee。

  为解决浮点指令以及shader的吞吐问题,Intel在Larrabee中引入的全新的Vector Unit,也就是向量处理单元,Vector Unit在结构上与Intel的AVX指令集非常类似,单周期可以吞吐16条32bit浮点指令,这使得Vector Unit在一般情况下拥有了超过AVX一倍的浮点吞吐能力。透过shader compiler的配合以及Scalar Unit的管理,Vector Unit在吞吐常规shader以及通用计算指令都时表现出了极高的效率。

重归正途迎未来 AMD全新GPU构架深度解析
Larrabee构架

  既然重新选择前所未有的方向对于深陷VLIW的AMD来说太过艰难,那不如干脆选择已有的类似模型和经验。于是在Graphics Core Next中,我们看到了AMD为我们奉上的全新Compute Unit单元。

重归正途迎未来 AMD全新GPU构架深度解析
Graphics Core Next CU结构

  新CU单元较之原有的VLIW CORE最显著的改进,来自ALU团簇部分的设计。传统RV构架的VLIW CORE采用4个1D ALU+1个全功能4D ALU(Cayman前)或者4个1D ALU(Cayman)捆绑并共享发射端等资源的方式,而伴随着VLIW的废弃,Graphics Core Next全新设计的运算单元也彻底抛弃了硬件单元的打包捆绑方式,直接采用16个Vector ALU划分一组SIMD CORE,每个CU包含4组Vector ALU的形式。每个16 wide vector ALU配备64K专有向量寄存器,并直接与CU内部的16K L1 Data cache以及64K LDS直连。另外,AMD还在vector ALU团簇外围放置了一个专门的Scalar Unit用于整个浮点吞吐单元的管理以及常规整数数据的吞吐,Scalar Unit拥有专有的8K寄存器。

  眼熟么?是的,我也觉得挺眼熟的。

三秦IT网的官方微信:更多资讯请关注:三秦IT网官方微博

图片新闻
ZOL产品报价:手机报价 笔记本报价 数码相机报价 服务器报价 MP3报价 MP4报价 投影机报价 数码摄像机报价 硬盘报价 内存报价
ZOL笔记本报价: 戴尔笔记本 联想笔记本 惠普笔记本 ThinkPad笔记本 神舟笔记本 索尼笔记本 华硕笔记本 三星笔记本 东芝笔记本 苹果笔记本
ZOL手机报价:诺基亚手机 MOTO手机 三星手机 索爱手机 多普达手机 联想手机 CECT手机 IPHONE手机 魅族手机 天语手机 LG手机
ZOL数码相机报价:佳能数码相机 索尼数码相机 三星数码相机 尼康数码相机 松下数码相机 理光数码相机 奥林巴斯数码相机 柯达数码相机