游戏性能测试方面我们将会采用三款知名游戏作品:《机器战争》、《F.E.A.R.》和《半条命2:第二章》。下图中的信息包括每款游戏的测试帧数(测试过程是在高分辨率下进行的):
我们通过截取被发送到一款常规显示卡里的DirectX 9命令流来获得游戏帧数,此时游戏的运行速度为标准速度。为了确保运算法则的正确无误并产生正确的图像,我们通过某种功能模式来测试游戏性能。之后我们以非常保守的态度估算出该功能模式下每个截面代码的成本,并为大致建立一个每帧图像轮廓。我们为具有最高成本的截面统一编写代码,并在精准的模拟器中运行,这种反复的改良将会不断被重复进行,直到执行一帧图像的时钟周期达到90%。此外,纹理单元吞吐量、缓存性能以及存储带宽限制都包括到各种各样的模拟当中。
我们从Larrabee units的角度来衡量游戏工作量的性能呢个。一个Larrabee unit被定义为一个1 GHz Larrabee核心。之所以选择1 GHz时钟频率仅仅是因为便于计算,实际上,Larrabee发布之后将会以多核心的形式出现,而且频率也不尽相同。利用Larrabee units,我们可以对具有不同核心数量、不同运行频率下的Larrabee进行性能对比。单个Larrabee unit理论上的最大吞吐量为32 GFLOPS,而且会把fused multiply-add运算计算为两个操作。