1997年6月19日,由国防科技大学研制的“银河-Ⅲ”并行巨型计算机在北京通过国家鉴定。该机采用分布式共享存储结构,面向大型科学与工程计算和大规模数据处理,基本字长64位,峰值性能为130亿次。该机有多项技术居国内领先,综合技术达到当前国际先进水平。目前,世界上只有少数几个发达国家掌握了高性能巨型机的研制技术。“银河-Ⅲ”巨型机的研制成功,使中国在这个领域跨入了世界先进行列。
中国巨型机研制实现“零”的突破
20世纪70年代,高性能计算成为推动科技创新和经济社会发展的战略高技术。然而,由于没有自己的巨型计算机,中国在经济社会发展当中常常受制于人。勘探出来的矿藏、石油数据资料,得送到国外去处理,不但花费昂贵,而且数据首先要被外国专家掌握。
“中国要搞四个现代化,不能没有巨型机!”1978年,在中央召开的一次重要会议上,邓小平同志的话掷地有声。就是在这次会议上,我国决定自主研制巨型机,以解决现代化建设中的大型科学计算问题。邓小平同志郑重地将这一重任交给了国防科大。
当时,国防科大虽是国内最早研制计算机的单位,但此前研制的“151”计算机,运算速度只有每秒100万次,如今要研制每秒运算超亿次的机器,意味着运算速度要提高100倍,技术难度可想而知。
“为中华民族争光!”面对前所未有的困难,科研人员们憋足了一股劲:豁出命也要搞出巨型机来,不让外国人卡我们的脖子。研制工作展开之后,各种复杂技术问题随之冒了出来。走什么样的技术路线?采取什么样的体系结构?如何实现每秒一亿次的运算速度……问题像一个个“拦路虎”。科研人员们迎难而上,把实验室当战场,夜以继日地进行着这场没有硝烟的战斗。
改革开放之初,我国工业基础薄弱,加工设备简陋,元器件落后,在这样的条件下,设计巨型机的艰难程度可见一斑。科研人员回忆,比如做计算机硬件的电路设计,当时纯靠一个一个在纸上画出来,画错了又得重新再来。一个小规模的集成电路设计,光画图就得半个月。
为了赶进度,大家吃在工厂,睡在机房,晚上至少工作到12点。当时,加班费一个晚上两毛钱,却没一个人愿意领。大家心里想的是省下每一分钱,尽快造出中国的巨型机。
经过5年没日没夜的顽强拼搏,以慈云桂院士为代表的科研人员,闯过了一个个理论、技术和工艺难关,创造性地提出了“双向量阵列”结构,大大提高了机器的运算速度,提前1年完成了研制任务,且经费只用了原计划的五分之一。
1983年11月26日,我国首台每秒运算1亿次的巨型计算机顺利通过了国家技术鉴定,标志着中国在巨型机研制领域实现了“零”的突破,成为当时继美、日之后,能独立设计和制造巨型机的国家。
此后,他们又依靠自主创新,相继研制出“银河-Ⅱ”“银河-Ⅲ”等一系列巨型机,一步步将我国高性能计算机研制技术推向国际前沿,经济社会发展中一系列迫在眉睫的问题也逐渐解决。
让天气预报提前7天左右
1994年3月,在市场激烈的竞争中,“银河-Ⅲ”正式立项。又用3年多时间,于1997年6月研制成功,实现了从多处理并行巨型机到大规模并行处理巨型机的跨越。该机采用分布式共享存储结构,面向大型科学与工程计算和大规模数据处理,基本字长64位,峰值性能为130亿次。
1997年6月19日,当运算速度为每秒130亿次的“银河-Ⅲ”研制成功后,中国气象局以此来做中长期数值预报系统,对于天气的预报由以前提前两三天推进到提前7天左右。这个系统综合技术达到了当前国际先进水平,并突破和掌握了更高量级计算机的关键技术,具备了研制更高性能巨型机的能力,它标志着我国高性能巨型机研制技术取得新突破。
“银河”巨型计算机系统是我国当时运算速度最快、存贮容量最大、功能最强的电子计算机。“银河”系列超级计算机如今广泛应用于天气预报、空气动力实验、工程物理、石油勘探、地震数据处理、卫星图像处理、大型科研题目计算、国防建设等领域,产生了巨大的经济效益和社会效益。
目前,只有少数几个国家能够研制巨型电子计算机。“银河”计算机的研制成功,提前两年实现了全国科学大会提出的到1985年“我国超高速巨型计算机将投入使用”的目标,使我国跨进了世界研制巨型机国家的行列。
中国超算研制水平跻身世界前列
进入新世纪后,我国各项事业进入高速发展时期,对高性能计算机的运算速度和容量都有了更迫切的需求。但与发达国家相比,我国不仅在计算能力上相差一个量级,装机数量也相去甚远。国防科大再次受命担负重任,吹响了攀登世界科技高峰的冲锋号--早日研制出我国的千万亿次超级计算机系统。
世界超级计算机的发展表明,计算能力每提高一个量级,都需要体系结构的创新和一系列关键技术的新突破。彼时,国防科大虽然具有较为雄厚的技术积累和丰富的工程实践经验,但要实现从百万亿次到千万亿次的技术跨越,同样困难重重。
面对多方面的技术难题与严峻挑战,科研人员群策群力,自主创新,努力攻克核心关键技术,推动我国高性能计算事业向前发展。
“天河”超级计算机之所以拥有全球最快的运算性能,其奥秘就在于它独创的“CPU+GPU”异构体系结构。然而,这一全新的异构体系在创建过程中,遇到了一系列重大技术瓶颈。“天河”超级计算机副总设计师杨灿群教授回忆说,GPU的特点是进行图形和视频处理,要将它和擅长运算的CPU组合在一起进行计算,不仅编程很难,而且计算效率也很低,国际上公认的计算效率最高只有20%。
创新的关键,就在于怎样把“不可能”变为“可能”,在没有路的地方走出一条路。超级计算机系统要实现每秒运算千万亿次,还必须有一个快捷通畅的网络系统,让各种信息“跑得快”。国防科大的研究团队不信邪,他们坚持走自己的设计路线,从头探索,努力攻关。仅用10个月时间,一款新型交换机研制完成,实测技术指标大大超过同类系统,而成本仅是同类同规模产品的80%。
随着一系列关键技术的突破与工程实现,2009年10月29日,我国首台千万亿次超级计算机“天河一号”研制成功,实现了我国自主研制超级计算机能力从百万亿次到千万亿次的跨越,成为继美国之后世界上第二个能够研制千万亿次超级计算机系统的国家。
来源: 江苏科技报