我是一名服务器管理员,平时最喜欢看《二言三拍》,短小精悍的文章让我爱不释手。前几天,由于单位服务器升级,让我接触到了一款名为晶芯的FB-DIMM内存。尽管这个螃蟹吃得很冒失,但凭借着该内存稳定的性能表现终于没让我“丢手艺”。
事情的经过是这样的:我们是一家线上贸易公司,由于目前外埠业务增长迅速,我们每天要进行大量的线上交易处理,这让我们两年前购买的两台单路服务器系统不堪重负。在经过了几次激烈争论之后,老板指派我对服务器进行整体升级和改造。这可是我这个“服管”大显身手的机会。经过对公司的业务流程的梳理和对未来业务增长的预估之后。我们决定直接采用双核芯的双路服务器系统。由于AMD的系统的功耗已大大超过了我们机房的限制,因此我们把目光定位于英特尔今年中旬推出的Woodcrest平台上。由于采用了酷睿架构,这一平台的功耗非常低,而且还支持最新的Fully Buffered-DIMM内存。这种内存能提供17~21GB/s的带宽,这样大的数据吞吐能力完全可以满足我们公司的需求。
定型了平台之后,我们很快就定购了相关的产品。但由于原厂商提供的升级内存价格昂贵,出于成本的考虑,我们决定只购买了1GB的机型,而内存则会选择第三方产品进行升级。没想到,正是这个决定让我着实痛苦了好一阵子。
机器很快搬来了,系统也平稳升级了,但瓶颈却在两个月内出现了,而当初想得美美的升级计划也遭遇了一次重大考验。由于FB-DIMM内存的生产工艺非常严格,而且Woodcrest平台尚在普及之中,因此在市场中很难买到合适的内存产品。几经周折,在朋友的帮助下买到一家著名品牌的内存(牌子不方便讲),但在我们的服务器上却出现了莫名其妙的兼容问题。眼看着公司业务因为服务器的问题而频频停滞,老板看我的眼神可想而知。而最可怕的是,在连续死机之后,服务器也彻底地罢工了,我们原来的“老黄牛”只能重新上岗。
没办法,退吧,我找到了我的朋友。这时,他试探着告诉我说:“有一家名叫晶芯的公司也推出了FB-DIMM内存,做工相当不错,而且据说稳定性还可以。更为关键的是,这家公司的内存性价比很高,许多用户买走之后就直接应用在刀片这样的服务器上。”
听了朋友的介绍,我将信将疑地决定将准备退掉的内存更换为这种内存。回到公司后,我尝试着将原来的内存拆下,换装上这条晶芯内存。开机、测试,自检、一气呵成。OK,再装上原来的内存,两条混插。同时,为了保险起见,我又进行了48小时的重压力测试。看着任务条上显示的连续50%以上双CPU负载,而系统未出现任何蓝屏。我这颗悬着的心终于落了地。
事后,我对整个服务器的升级过程进行了总结。我这才发觉,服务器之所以死机的原因是散热不佳所造成的。由于服务器厂商在设计主板内存槽时,只考虑如何与本厂的内存兼容。因此对于其他内存的散热通道基本没有太多的照顾,我们之前买的内存死机就是这个原因。而后来购买的晶芯内存,在PCB方面设计得非常精良,特别是对内存片上发热量极大的AMB芯片进行了很好的散热处理,使得其不但兼容性非常好,而且稳定性也远非其他内存可比。因此,在下一次的内存采购单中,我已经提前将晶芯的名片列为其中。
顺便说一句,如今这台服务器已经稳定工作了两个多月,至今未出现死机的问题,而老板对我的态度也大为改观,许多与信息相关的高层会议也要求我参加了。我估摸着如果公司发展壮大了,没准我也会弄个CIO当当,呵呵。