首页| 论坛| 二 手| 模拟攒机| 代理商大全| 方案查询| 手机| 笔记本| 视频| 软件下载| 排行榜| 经销商| 全国行情| 招聘|小游戏| 黄页| 博客| 商城

从10年前说起 Intel新独立显卡万字解析

中关村在线 作者:ZOL 编辑:白林 02-23
 

  当RTset单元用三角形图像数据填充bin这一前端处理过程完成之后,RTset单元将会被放入一个活跃名单中。负责后端工作的核心不停地从名单中调用可用tile,并在相关bin里渲染三角形图像。这种软件可以采用很多优化操作,这些优化通常都会用当今GPU中的逻辑芯片来执行,比如说fast clear、hierarchical Z 以及early Z tests。其中,hierarchical Z优化操作可以在前端过程执行,同时减低bin单元里primitive的数量。

  后端处理代码首先会预取渲染目标像素,并放入L2高速缓存里。之后所有的渲染操作将会在L2缓存中执行,直到tile单元中没有可渲染primitive存在才会停止,这是渲染操作将会被写入存储单元。结果,此tile单元中的RTset的像素仅仅需要被写入/读取主要存储单元,不管bin单元中有多少重叠的primitive单元。与此同时,两个重要优化操作可以被检测出来,并节省大量存储带宽。如果第一个命令要求清除整个tile的话,读取过程可以被消除。写入操作也可以因为渲染之后某些不必要的depth data而被消除或者减少。


Intel制霸显卡新起点 Larrabee全解析

  一个tile单元的后端渲染顺序: setup thread处理primitive单元,并为primitive分配三条工作线程中一条,这些线程负责处理early Z depth tests、pixel shader processing、late Z depth tests,以及alpha blending。

  这三条工作线程执行所有未被执行的像素处理,包括pre-shader early Z tests、 pixel shader、regular late Z tests以及post-shader blending。目前的GPU采用专门的逻辑芯片进行post-shader blending,而Larrabee采用的是VPU单元。Larrabee的这种操作方式效能非常高,因为很多shader都不用post-shader blending,所以专门的blending逻辑芯片不被用于某些shader处理,而且如果使用的话可能会限制其他shader的性能。

  下面我们再来了解一下纹理合作处理器通道(texture co-processor accesses)。纹理合作处理器通道可以具有数以百计的延迟时钟。这些延迟可以被每个硬件线程的qquad通过处理隐藏起来。一个qquad的shader被称为一个fiber 。一条线程上的不同fiber可以相互切换,而且不受OS的影响。一个fiber切换会在每个纹理read命令之后被执行,并传递给在该线程上运行的其他fiber。fiber的数量是可以选择的。

文章评论
相关新闻
关于我们 联系我们 三秦IT网在线论坛 商家注册 商家列表 人才招聘 硅谷BLOG
建议使用:1024*768分辨率、32Bit颜色、FLASH Player 6.0、IE6.0或Firefox1.5以上版本浏览器和中文大字符集
Copyright 1999 - 2009 3QIT, All Rights Reserved 三秦IT网 版权所有

陕ICP备05007135号