已公布的测试成绩
AMD对Folding@home的支持早于NVIDIA,但NVIDIA的支持力度却远远大于AMD,从斯坦福的最新官方统计中即可获得结果。
从统计资料上看,无论是GPU数目还是总运算量,NVIDIA都领先于对手AMD。
两大厂商的推广,使得CUDA和GPGPU概念迅速普及,广大爱好者终于可以在使用高性能显卡运行游戏的同时,试着参与分布式运算工程。从统计资料上看,无论是GPU数目还是总运算量,NVIDIA都领先于对手AMD。然而PS3由于在销售时就对Folding@home做了大量优化,使之在PS3主机后台一直运行,同样提供了非常大的运算总量。但从运算效率这个主要指标来看,NVIDIA还是取得了一定的领先。
以PPD(Points Per Day每日运算得分)为主要指标,斯坦福官方给广大玩家列出了以上两张表格,结果令人惊讶:即使是拥有320个流处理器的3850,也只是微弱领先于8600GT。8800GS凭借96个流处理器的优势,领先于游戏性能强于它的9600GT。按能效评价,384MB版本的8800GS获得了77.1的每瓦特PPD性能,而AMD最好的3850系列显卡每瓦特PPD性能只有32.82。在正式运算时,3850的速度更是出人意料得只有9600GSO的一半都不到,这让AMD显卡的爱好者非常意外,因为在实际游戏测试时,3850略强于9600GSO。
事实说明,Folding@home相当耗费流处理器资源,并且对流处理器的运算效率提出了严格要求,这项运算中,指令间因果和引用嵌套联系非常密集。
G80这种MIMD(Multiple Instruction Multiple Data,多指令多数据流)架构超标量流处理器,将GPU Shader执行效率做出了大幅度提升。而HD2000/3000系列使用了SIMD(Single Instruction Multiple Data,单指令多数据流)架构“超标量”架构的5D着色单元,虽然流处理器数量要远大于GF8/9系,而且晶体管开销更少,但在不同游戏中的性能表现反差很大,总体来看执行效率不如人意,对于驱动程序的依赖性非常严重。
在Folding@home运算中,AMD的设计思路导致了原本微弱的性能差距被快速放大,我们还可以注意到,4850在游戏方面远超3850,但这项运算中仅仅领先前辈10%左右。同样CUDA目前来看拥有强大的普及优势,更多软件支持CUDA加速,Geforce 8、9系列的GPU越来越得到高效利用。当然,我们非常期待AMD能在未来GPU架构设计方面做出转变,使任务的分配更加高速合理,最大限度地利用其流处理器资源。同时,作为分布式运算的支持者,我们希望越来越多的大型项目能支持CUDA等GPU通用计算架构,加速科学研究进程。