说到图形芯片技术,2008年是NVIDIA丰收的一年,在同一渲染架构的基础上,它在数量和规模上又获得进一步提升。
●两年时间SP单元提升近一倍
说到同一渲染架构的诞生,还得追述到2006年底,G80显示核心第一次抛弃了沿用多年的“顶点、纹理”着色器之分,由一种简称为SP单元的统一着色器取代两者。缘于功能和物理性质的区别,NVIDIA让SP着色单元运行在比光栅处理器更高的频率上,尽可能地增强纹理渲染效率。此架构还符合微软DirectX10引擎的运行模式,这就是NVIDIA提出的CUDA概念的主体。
统一着色器的相较以往的优势在于可以根据程序的资源需求来合理分配图形处理单元,去从事原先顶点和纹理单元专属的工作,这能大幅度提高核心晶体管在每一时刻的利用率,从而使实际性能也有明显提升。
继G80之后,NVIDIA又推出了G92显示核心,后者将工艺制成提升至65nm,可总体架构没有太多变化,只是取消了G80额外的128bit显存接口,依然使用256bit,如此一来便使芯片良率和芯片频率得以惊人的增长。
GT200-300-A2显示核心
2008年,NVIDIA统一渲染架构终于获得真正意义上的突破,虽然总体工作模式没变,但核心内着色器规模真的是今非昔比了。
GTX280显卡架构
GT200核心拥有240个统一着色器,32个光栅处理器,显存位宽接口也因此激增至512bit。这样各个环节的数据流量都有所增加,整体性能便有了全方位提升。在GT200核心问世不久,NVIDIA又研发出了能够开启GPU物理加速功能的驱动程序,可以利用GT200数量庞大的并行线程承担物理即时演算的工作,全面解除了CPU的负担。尽管目前物理特效在3D程序中应用的成分并不高,但从专项测试效果中可以预见,我们应对未来更为逼真的游戏已有良策。
GTX280显卡实物
基于GT200核心的GTX280显卡成为NVIDIA当前最高形象。
●资源利用率的重要性无处不在
便于读者对统一着色单元的理解,这里举个形象的例子:最早战场上使用的机枪有轻重之分,重机枪散热好,射击稳定性强,载弹量大,但是机动起来相当不便,必须有两三个人伺候着。轻机枪轻便灵活,机动性强,可是弹药携带有限,散热和射击稳定性也不如前者。德国人在二战中首次提出了“通用机枪”概念,设计出一种机枪装上三脚架,配上备份枪管和大弹箱就是重机枪;装上两脚架和弹鼓就是轻机枪,可单兵手持射击,而且两种模式的转换仅需短短的几分钟。结果令盟军伤亡惨重,枪下游魂无数,这便是著名的MG42。由此可见,能做到随时地,最大限度地合理分配资源对任何事物都是尤为重要的。