首页| 论坛| 二手| 模拟攒机| 代理商大全| 方案查询| 手机| 笔记本| 视频| 软件下载| 排行榜| 经销商| 全国行情| 招聘|小游戏| 黄页| 博客| 商城

从10年前说起 Intel新独立显卡万字解析

中关村在线作者：ZOL 编辑：白林 02-23

　　当RTset单元用三角形图像数据填充bin这一前端处理过程完成之后，RTset单元将会被放入一个活跃名单中。负责后端工作的核心不停地从名单中调用可用tile，并在相关bin里渲染三角形图像。这种软件可以采用很多优化操作，这些优化通常都会用当今GPU中的逻辑芯片来执行，比如说fast clear、hierarchical Z 以及early Z tests。其中，hierarchical Z优化操作可以在前端过程执行，同时减低bin单元里primitive的数量。

　　后端处理代码首先会预取渲染目标像素，并放入L2高速缓存里。之后所有的渲染操作将会在L2缓存中执行，直到tile单元中没有可渲染primitive存在才会停止，这是渲染操作将会被写入存储单元。结果，此tile单元中的RTset的像素仅仅需要被写入/读取主要存储单元，不管bin单元中有多少重叠的primitive单元。与此同时，两个重要优化操作可以被检测出来，并节省大量存储带宽。如果第一个命令要求清除整个tile的话，读取过程可以被消除。写入操作也可以因为渲染之后某些不必要的depth data而被消除或者减少。

Intel制霸显卡新起点 Larrabee全解析

　　一个tile单元的后端渲染顺序: setup thread处理primitive单元，并为primitive分配三条工作线程中一条，这些线程负责处理early Z depth tests、pixel shader processing、late Z depth tests,以及alpha blending。

　　这三条工作线程执行所有未被执行的像素处理，包括pre-shader early Z tests、 pixel shader、regular late Z tests以及post-shader blending。目前的GPU采用专门的逻辑芯片进行post-shader blending，而Larrabee采用的是VPU单元。Larrabee的这种操作方式效能非常高，因为很多shader都不用post-shader blending，所以专门的blending逻辑芯片不被用于某些shader处理，而且如果使用的话可能会限制其他shader的性能。

　　下面我们再来了解一下纹理合作处理器通道（texture co-processor accesses）。纹理合作处理器通道可以具有数以百计的延迟时钟。这些延迟可以被每个硬件线程的qquad通过处理隐藏起来。一个qquad的shader被称为一个fiber 。一条线程上的不同fiber可以相互切换，而且不受OS的影响。一个fiber切换会在每个纹理read命令之后被执行，并传递给在该线程上运行的其他fiber。fiber的数量是可以选择的。

上一页 [11] [12] [13] [14] [15] [16] [17] [18] 下一页

本文导航：

文章评论

MWC | 中国家电博览会 | 大金空调 | 海尔空调 | 海尔冰箱

图片新闻

驯服一切BT游戏微星GTX295超频版揭秘

美女玩极限首款PhysX物理特效游戏详

轻松击败9800GTX 非主流HD3850X2测试

压倒性领先GTX280 HD4870 X2性能全曝

热点新闻