峰值速度每秒11万亿次、在世界上率先使用网格路由器、跨越32位计算和64位计算“界河”……中国目前最快的超级计算机曙光4000A15日在上海正式启动。这意味着什么?它给试图跨越的中国高科技,以哪些经验和启示?
一条充满荆棘的产业化之路:“中国人进入超级计算前列”
在中国高科技发展中,“曙光”无疑是一个耀眼的团队。
高性能计算机是国家信息基础设施的核心设备,是一个国家综合国力的重要标志之一。上世纪90年代,面对发达国家的禁运和封锁,在科技部等部门的支持下,以李国杰院士为首的团队从无到有,夹缝中求生存,发展曙光系列高性能计算机,打破了我国高性能计算机被国外一统天下的局面。
曙光一号、曙光1000、曙光2000、曙光3000、曙光4000A……1990年迄今,一路走高的曙光在产业化道路上一枝独秀:曙光机群售出1400多套,在教育、税务、石油、气象、金融等领域获得成功应用。曙光的存在,更是形成良好的技术外溢效应,国外公司纷纷调整战略,降低报价,中国高性能计算水平水涨船高。
一路走高,并非一帆风顺。“曙光”发展之路貌似平坦,实则充满荆棘和险滩,曙光4000A这步跨越更属不易。有心人也许还记得,2003年7月23日,国家智能计算机中心主任孙凝晖公布了10万亿次计算机的时间表:2003年9月,计算机节点批量生产;2004年6月,用户安装。而实际上,安装时间比计划拖后了两个月。
总体设计、详细设计、测试、实验、编码、调试……虽然时间有所延后,但中国科学家在短短一年多的时间里做出了漂亮成绩。曙光4000A的完成情况超过一系列设计指标。峰值速度从10万亿次提高到11万亿次多,内存比设计指标增加了25%,存储是设计指标的4倍多。
“曙光4000A是全世界机房条件最差的十万亿次机,但在工业标准机群上达到了世界最好水平。”专家指出,曙光4000A实现了国产超级服务器在主板设计等核心级技术上的重大突破和工业标准机群的技术增值,攻克了一系列大规模机群计算的关键技术,造价和功耗远远低于国内外同类计算机。“我们自主设计的主板和节点模块领先IBM、英特尔一年以上。”
十多年来一直引导国内高性能计算机方向的曙光,再次引起国内外强烈关注。计算所专家频频应邀出席国际会议。日本、美国将目光投向曙光机,甚至以此游说政府增加投入。国外一家专业杂志评论“中国人已经进入超级计算前列。”
一项日益重要的成功经验:需求是动力,合作能共赢
企业有世界五百强,高性能计算机也有世界五百强。一张长方形的证书上,“NO.10”几个字格外醒目,这是曙光4000A在今年6月获得的全球超级计算机500强第十名证书。证书背后,伫立着中科院计算所、曙光公司和上海超级计算中心精诚合作的团队。
面向需求,合作共赢,也许是曙光4000A最成功的经验。研发伊始,曙光4000A就瞄准了重大应用——作为面向网格的新一代超级计算机,为上海乃至全国科研单位、企业服务,为国家网格计算提供坚实发展平台。
随着经济的快速发展,作为全国首家面向社会开放的高性能计算公共平台,运行3年多的上海超算近年来主机处于饱和状态,十多家用户排队等候上机。“我们对50多家单位进行调研,发现上海市未来几年的高性能计算需求还在急速增长。”
根据性能先进、经济实用、支持国内高性能计算机发展的原则,经过多方案的比较选择,酝酿实施二期扩建工程的上海超级计算中心最终把新机型确定为曙光4000A。“我们把研发引进新机型和国家863网格主节点两项任务合二为一,进行统筹考虑。”上海市副市长严隽琪说。
上海超算并非将钱一给了之。“我们参与了近一年的研制过程,从未来业务的应用需求出发,对新机型的架构、配置和应用系统等方面提出了更便于使用的优化方案,使其能满足多种类型的应用需求。”上海超级计算中心主任傅文彪说,“我们也积极整合内部资源,加快软件平台的配套,使这一计算机能更好地发挥其强大功能。”
2004年9月,在被装成六辆大车成功运抵上海安装后,曙光4000A开始试运行。“挺顺的,两个多月在机器上‘跑’了近30种大型商用和科学计算软件,500多块CPU主板一块都没有换过,这是很少见的。”上海超算中心副主任王普勇说。
铁一样的事实,让原来还有点担心的上海人信服了:曙光4000A的稳定性、可靠性都很过硬,甚至超过了国外同类机器。
“曙光4000A的重大意义主要不在于研制出了一台超过10万亿次的超级计算机,而是满足了以上海市为代表的中国用户对10万亿次计算机实实在在的需求。”李国杰说。
从科学计算到工业应用,从飞机设计到汽车碰撞,上海超级计算中心负责人指出,曙光4000A启动后,将源源不断地为企事业单位提供计算能力,就像电厂提供电力一样。
一个至关重要的启示:“顶天立地”真英雄
“我们不要太看重排名。”对于世界第十,对于人们津津乐道的11万亿次,李国杰十分清醒, “不要盲目攀比峰值,要强调追求实际应用的效率。”
的确,实践证明:曙光4000A的性能价格比遥遥领先于同类产品。它的峰值速度虽然没有IBM2001年研制的一台计算机高,但标准测试的运算速度却高于对方,价格上更只有对方的1/10。在功耗、占地面积等硬指标上,它也优势明显。
“十年左右,曙光高性能计算机的性能增长了近7千倍。”李国杰说,曙光之路的最大启示是,我国高性能计算机产业要走向规模化,必须实施“顶天立地”战略:企业在技术上要“顶天”,以技术发展为先导,立足技术领先;应用上要“立地”,将技术融入实际应用的解决方案中。
“我们一定要敢于啃硬骨头,也有能力来啃硬骨头,要做成事关国家经济社会发展和国家安全的大事,做成提高本土高技术产业竞争力的大事。”李国杰说,“中国做高技术研究,不但要有过人之处,而且要有胆识和魄力。我相信中国的科技人员在崇高理想的前提下,是能够以小米加步枪胜过飞机大炮的。”
在对成果给予充分肯定后,6月29日,专家鉴定委员会做出了希望国家继续大力支持高性能计算机的研究,希望加大曙光4000A产品的市场化力度的意见。
最近,一连串消息传来:9月29日,IBM宣布其制造的浮点运算速度每秒36万亿次的蓝基因超级计算机成为世界第一;不到一个月,这一记录被刷新——10月20日,日本电气公司宣布推出世界最快的向量计算机,峰值速度可达每秒65万亿次;10月26日,美国英特尔公司等宣布浮点速度42万亿次的哥伦比亚超级计算机部署完毕。
高性能计算领域内,一场世界范围的新角逐正在悄然上演。而信心满怀的中国科学家正劈波斩浪,奋然前行!