● 大一统的未来?
尽管对目前的TMU单元被畸形利用的现状存在不满,但我们也不能无视和否认TMU单元与像素处理单元之间密不可分的合作关系。图形流水线在此之前和之后都是严格的单线顺序关系,虽然存在回溯等必要操作,但像TMU单元和像素处理单元这样并行同时又不断的彼此发生联系的处理过程,在整个GPU流水线中就仅此一处而已了。
纹理和像素操作在流水线中的地位
既然TMU单元对纹理的操作,归根结底实际上还是对像素的操作,只不过更多的局限于复制粘贴之类动作,而像素处理单元虽然一上来就火力全开进行着各种计算,但实际上也是在处理像素,这两个单元在动作时还会时不时的眉来眼去一下,那有没有一种可能,在未来的某一天出现一个单元,将TMU和ALU阵列统一成一个完整的“效果处理器”呢?
同CPU和GPU的关系类似,实际上TMU和Shader的关系很像是一个“分裂-合并”的过程,最初的表面特效全部由TMU单元来实现,后来出现来自性能和需求端的变化之后,像素处理单元才独立出来进行像素相关的特效处理。如果能够实现完整统一的“效果处理器”,或者类似Direct Pixel Texture那样,以直接生成像素的形式来取代现有的“纹理-像素-混合”机制,那不仅可以让表面的颜色处理过程再次得到统一,回避目前纹理-像素切换操作所造成的延迟,还能让后端的ROP单元得到相当程度的解放。统一之后的像素处理机制将从大幅削减的切换延迟中获益,而节约下来的晶体管也可以用来强化缓冲以及其他单元。另外,统一像素处理还能让图形编程变得更加简单直接,简洁的程序反过来又能够进一步提升图形执行过程的效率,这样的诱惑不可谓不大啊。
Id Tech5直接以像素实现的“虚拟纹理”效果
其实在之前的GPU大百科全书中我们曾经提过类似的问题,受限于由此激增的,甚至是以数量级为单位激增的运算量的限制,可以说在可见未来内,我们应该还无法看到类似的设计。但我们同时也应该注意到,当今GPU的发展,尤其是ALU运算能力的增长,本身也确实在以超越摩尔定律的方式进行着。也许在不久的将来,我们还真的有可能看到TMU单元和像素单元的再次统一呢。
● 尾声
TMU是一个神奇的单元,它常年被认为是最传统的纯图形操作者,但却又是第一个站出来将GPU引入通用计算时代的先驱;它在卸下实现几乎全部特效的责任和重担之后反而获得了快速的发展和长足的进步,甚至还出现了各种各样以前不敢想象的操作方式和手段,并借此实现了更多过去很难实现的特效;它还在市场的推动下再次冲到了图形舞台的正中,成了人们实现特效最为依赖的对象。
TMU单元的一生,真可谓跌宕起伏啊。
混合输出过程
在经过连续两章的处理过程和功能单元的游历之后,我们已经完成了对新生的图元生命表面效果的处理。在这之后我们所要做的事情,就只剩下将这些效果“落实”了。落实表面处理效果的过程,实际上就是将平面化的模型、纹理以及对纹理上不正确像素的修正替代结合在一起的过程,也就是我们通常所说的混合输出,这一步的操作,是由GPU中另一个资历颇老的单元——ROP单元来完成的。
在下一章的GPU大百科全书中,我们将要面对图形处理过程的最终环节以及ROP这一图形流水线上最后的大型单元,这最后的环节和单元里究竟蕴藏着哪些故事,我们又会面对哪些新奇的经历呢?关于这些疑问,就让我们留待下期GPU大百科全书中慢慢揭晓吧。
三秦IT网的官方微信:更多资讯请关注:三秦IT网官方微博