在G92核心的潜力已经被挖掘尽后,NVIDIA在2008年6月份推出了全新的GT200核心。代号GT200的GeForce GTX 280是NVIDIA基于第二代统一着色器及计算架构的第一款产品,架构归属于为G100,在性能上相对上一代的产品(G80)来说快大约50%到100%。NVIDIA的旗舰GeForce GTX 280集成14亿晶体管电路,拥有240颗流处理器,配备了1GB GDDR3显存,采用了512-bit位宽,显存带宽高达141.7GB/s,成熟的65nm技术让GT200虽然庞大,但是功耗和发热都处于可控范围。
图注:NVIDIA的高端旗舰GeForce GTX 280显卡
●GeForce GTX 200系列产品 技术优势:★★★★★ 市场优势:★★★☆
但是GT200核心遇到了一些市场定位问题,在性能方面GT200几乎没有任何悬念的击败了上一代高端卡GeForce 9800GTX+,但是过分强化通用计算性能让GT200在图形运算方面无法战胜自家的单核双芯产品GeForce 9800GX2。相反由于更多的即晶体管数量以及512bit的显存位宽,GTX280显卡在成本以及功耗上的表现令人乍舌,NVIDIA的新一代旗舰面对市场叫好不叫座的尴尬……
实际上GT200在架构方面有很多先进之处,比如说它首次提出“Gaming Beyond和Computing Beyond”将GPU通用计算的地位逐渐提升,让普通用户也开始关注。SIMT和shared memory也让通用计算的编程门槛降低,双精度能力则拓展了GPU通用计算的适用范围,但是图形方面GTX280并没有革命性的改革,产品线方面,NVIDIA最终没有把硕大的芯片做小,而只是在后期改进工艺后推出了GTX260+、GTX275、 GTX285和双芯GTX295产品,没有一款基于GT200架构的GPU能够下探到500元到800元人民币的中低端市场。
代号RV770的Radeon HD 4870、HD 4850和GT200一样属于第三波次的DirectX 10产品,不过和GT200几乎完全性能先决的策略不同的是,RV770走的是攻占中端市场,避开了NVIDIA旗舰级GT200架构的锋芒,为广大的普通用户创造了极具价值GPU选择方案。
ATI在技术落后的大背景下,推出了市场定位精准的RV770芯片,其代表作Radeon HD 4870显卡获得了ATI进入DirectX10时代以来最广泛的认同。
●Radeon HD 4800系列产品 技术优势:★★★★ 市场优势:★★★★★
RV770拥有10个SIMD Core,每个SIMD Core内的VLIW单元数量为16个,因此从SIMD内核数量看RV770是RV670的2.5倍,而SIMD内核中的运算资源并没有变化,VLIW单元数量从64个增加到160个。因为每个VLIW单元是“1大4小”结构,即一个全功能SP单元和4个仅能执行乘加运算而无法执行连乘运算的部分功能SP。所以整体上RV770拥有800个流处理器。
RV770运算资源的大幅度扩充带来Shader单元的性能提升,但是让NVIDIA更没有想到的是ATI潜心研究改进了R600以来GPU的后端设计,主要是RBE(Render Back-End)单元,也就是NVIDIA所称的ROP单元。RBE单元主要用来实现多重采样和抗锯齿以提高画质或者降低高画质下GPU的性能衰减。
除了RBE单元的改进,ATI还做了一项工作,那就是彻底摒弃了一直处于争议的R600 Ringbus环形内存控制器总线,使用AMD擅长的Crossbar总线。Ringbus最大的优势在于可以用最少的晶体管来实现最大的带宽,但是Ringbus的代价是极大地整体延迟和粗糙的数据流动管理。业界公认的最快的互联方式只有Crossbar,NVIDIA虽然承受着高集成度带来的苦恼,但一直坚持使用Crossbar。
这3方面的改进让Radeon HD 4870成为一款在性能和功耗上表现优秀的GPU,同时不触碰NVIDIA最高端产品的思路让ATI获得了中高端的大量市场份额。加之以往积累下的细分市场经验,Radeon HD 4000系列在中低端也诞生了普通用户能够接受的产品,在多个市场层面形成了对市场的控制和对NVIDIA的冲击。这时的NVIDIA虽然在最高端无忧,但是在主流市场上只能用G92的衍生核心来保护逐渐被ATI抢走的份额。