Larrabee加载平衡模拟测试的结果表明:48核心Larrabee线性加速下,游戏性能将会下降7%-10%。对于该测试,如果Larrabee的PrimSet单元包含超过1000个primitive单元的话,PrimSet会被再次细分。此外,测试还表明,如果PrimSet单元被细分为几组200个primitive时,F.E.A.R.的游戏性能仅下降了2%,所以说code tuning(代码调节)应该提升线性。
那么,若要保证游戏在60 fps或者更快的水平运行,各款游戏需要多少个Larrabee Units (每颗核心的运行频率为1 GHz)?
下面描述的是在以每秒60帧的速度运行的游戏中,Larrabee units的数量需要渲染的样品图像帧数。这一测试结果是用单核心模拟测试得出的,且假定性能为线性。若要保证游戏在60 fps或者更快的水平运行的话,《Half Life 2 episode 2》大约需要10个Larrabee Unit;而对于《F.E.A.R.》和《Gears of War》则大约需要25个Larrabee Unit。
此外,影响Larrabee可扩性的因素为软件lock。在如此高的画质下,软件渲染的模拟multiple frame的成本代价是相当高的。尽管如此,Larrabee这种软件渲染管线可以最小化lock的数量以及其他同步事件。通常来说,以下情况将会大致获得或者释放一个lock:
如今的游戏通常情况下每帧图像画面不少于10000个lock。Larrabee环形网络为每颗核心、每个lock大约100个时钟的low-contention lock提供了相对不错的性能。