7. blas_example (线性代数运算)
测试结果:如图11所示为1U服务器进行线性代数运算的结果曲线,表示随矩阵规模的增大,计算时间也随之增加,在矩阵规模为2000时的计算时间约为140毫秒。
如图12所示为在“倚天”上进行线性代数运算的结果曲线,其中红线为基于“倚天”CPU的运行时间曲线,绿线为基于“倚天”GPU的运行时间曲线,蓝线即为相应的矩阵规模下“倚天”GPU相对于“倚天”CPU的加速比曲线。从结果显示,在矩阵规模为2000阶时,“倚天”GPU的运行时间仅为50毫秒,相比1U服务器性能提高了2.8倍。
可以看到,同傅里叶变换的测试类似,随着矩阵规模的增大,利用GPU进行线性代数运算的优势更加明显,相对于CPU的加速比一直处于上升的趋势。
图11. 1U服务器运行结果及效果图 图12. 倚天运行结果及效果图
五、测试结论:
由以上涉及工程与科学绘图、图形图像处理以及数值运算等应用领域的7个Matlab算例的测试结果可以看出,“倚天”无论在计算运行时间上,或是在图像模拟的质量、真实感和实时性上,都要相比主流配置的1U服务器性能优越很多,性能加速的倍数因应用算例不同而略有差异,在几倍到几十倍不等,个别算例甚至可以提高100多倍。这样的性能加速对于研究人员无疑是个好消息,在“倚天”这样拥有超强运算能力的平台上进行科学计算和模拟,再也不用因长时间等待计算结果而苦恼了。
目前,数以万计的软件开发人员正在使用免费的CUDA软件开发工具来解决各种专业应用程序中的问题。浪潮“倚天”凭借创新的协同计算加速架构,在低成本的范围内实现了计算性能万亿次的突破,并且以优化的单机产品形态,破解了系统功耗、体积、噪音、便携性等一系列难题,进一步降低了HPC的应用门槛,为高性能计算的发展开辟了新的天地。
相信GPU高性能计算技术在生命科学、工程科学、石油天然气勘探、金融、医学成像以及视频与音频处理等高性能计算领域有着广阔的应用前景,浪潮“倚天”的普及将为广大科研机构及企业带来计算性能的巨大提升,同时也为我国高性能计算的普及开拓了新的路径。