·劳苦功高的SSE多媒体指令集
众所周知,在第一代多媒体指令集MMX被推出以来,几乎每隔几代处理器英特尔都会对其内置的多媒体指令集进行更新。而目前英特尔的第五代Streaming SIMD Extension 4(SSE4)指令集除扩展Intel 64位指令外,还新增对于影像编辑、视讯编码、三维渲染以及游戏应用等方面的指令,使得处理器的效能更进一步。
本次升级的第五代SSE4多媒体指令集将分为SSE4.1以及SSE4.2两个版本,而这次Santa Rosa Refresh平台所升级的Penryn处理器则使用了其中的SSE4.1指令集。更新后的SSE4.1多媒体指令集共增加了47条指令并且引入了两组不同的32-bit向量整数乘法运算单元能够对八位无符号最大值以及最小值运算提供支持。另外新加入的16-bit/32-bit有符号和无符号运算支持,能够有效改善编译器执行效率并提升向量整数以及单精度代码的运算能力。
不仅如此新加入了6条浮点型点积运算指令的SSE4.1已经能够对单精度、双精度浮点运算及浮点产生操作提供支持,且额外的IEEE 754指令(包含Nearest、-Inf、+Inf、与Truncate) 也可以保证转换路径模式立即运行,在减少了系统延迟时间的同时也对3D应用给与了极大的便利。
得益于以往SSE多媒体指令集的优势,处理器在视频编码上也颇具优势。本次的SSE4.1多媒体指令集中增加的串流式负载指令,能够提高图形帧缓冲区的读取数据带宽,可以在理论上获得更加完整的缓存行并以64字节的数据线宽读取显卡帧缓冲区,相较以往的8字节架构有很大程度的速度提升。
·超级Shuffle同样功不可没
仅仅拥有新的多媒体指令集仍旧不够,Penryn处理器内置的超级Shuffle引擎和SSE指令集能够相互关联,使多媒体指令运算效率获得较大幅度的提升。
以往在处理128位宽度的字节、字以及Dword SSE数据时,处理器并不能将这些整合在单一周期内运行,必须将一个128位数据拆成2个64位进行处理器,当然再加上处理数据的时间则一共需要2个周期。但超级Shuffle引擎设计可以允许处理器在不经过软件部分改良的基础上将多种性质的128位SSE指令放在1个周期内完成。