·新一代Radix-16处理器赋予Penryn更快的速度
在拥有酷睿架构的一系列优点之外,新的45nm Penryn处理器进一步的改良了除法器的设计,对比早先的产品提升了约2倍左右的性能。新的除法器被称为“Radix-16”,对比以往的Radix-4或者Radix-2除法器,后者在单一周期内只能传递2bit数据,而新的快速Radix-16除法器则可以传递4bit数据。
也就意味着Penryn处理器能够达到单周期处理多达4个指令,并且14层流水线设计也提升分支预测的能力及准确性,分支预测的带宽提升至20byte (K8、Banias 为16byte,Netburst为4byte),令指令执行效率大大提高。新的Radix-16除法器在大幅改善宽位动态执行的效率的同时,也在加速浮点以及整数的除法运算速度,在针对科学计算、数学运算以及3D坐标的转换中有着较大程度的提高。
说到快速操作系统原语支持是指,当操作系统遇到临时阻碍、遮蔽中断指令且影响关键代码区段,或者是类似输入输出设备需要独占存取等情况的时候,处理器可以快速的中断遮蔽控制机能,清除以及重置中断,并快速进、出此状态模式,大幅改善该类型操作。基于此,Penryn可以快速执行XCHG、ADD、XADD、NEG、BTS、AND、CMPXCHG等锁定指令,以及快速存取读取时间印记计数器。英特尔称:快速操作系统原语支持技术可提高2倍的执行效率,对数据库服务器、交易处理服务器等应用有特别明显的性能提升。Intel经由强化微架构设计,缩短VT-x指令转换虚拟主机进入、离开时间,无须修改现有虚拟主机软件,就能增加25%~75%的执行效率。
·小群组拥有大能力,Associativity技术大幅提高缓存命中率
对于处理器另一个重要的部分,相信很多资深的DIY玩家会选择其高速二级缓存。对于处理器来说,高速二级缓存是介于处理器与系统之间的一个缓冲区,处理器会对缓存内的数据进行预读以提高程序及指令的运行效率。新的45nm Penryn处理器在高速缓存上加入了一种“小群组”概念并称其为“Associativity”,该技术将高速缓存分割成多个区块。这样做的好处是可以加速数据读出以及写入,而不用在容量日趋增大的缓存中对数据进行查询。
由于这种小群组的个数跟快取失误率及额外的延迟时间有关,所以小群组的数量越多便能够降低数据覆盖的几率,减少快取失误几率从而提高命中率。相比以往的16路设计,Penryn处理器在此基础上增加到了24路,以目前Penryn处理器的二级缓存数量来看,理论上可以更加进一步的降低失误率。
需要说明的是,这种“Associativity”也是一柄双刃剑。处理器会因为缓存中小群组数量过多,会逐一的按照群组对数据进行查询,这样的后果就是延迟时间不但不会缩短,反而会变得更长。
另外在本次推出的5款Penryn处理器中并不是所有的型号都具备有24路Associativity技术,其中内置有3MB缓存的Core 2 Duo T8100与8300就只有12路Associativity,而二级缓存为6MB的T9300与9500才拥有24路组联。