|
翻越中国高性能计算发展道路上的“三座大山”
纵观中国高性能计算的发展,是中国科研人员艰苦奋斗、开拓进取的历程,翻越了打破封锁(1956—1995 年)、打破垄断(1996—2015 年)和引领创新(2016 年至今)的“三座大山”(表 2),逐步缩小了与国外研制水平的差距,并最终在整机系统设计和关键技术上取得了世界领先的成就。
打破封锁
这一阶段,我国在国外封锁的条件下,研制专门的高性能计算机为“两弹一星”等国家重大战略需求提供支撑。研制机器的主要应用在国防军事领域,以及传统科学计算领域。代表性的系统包括电子管计算机(如 103 机、104 机、119 机)、晶体管计算机(如 109 乙机、109 丙机)、基于中小规模集成电路的计算机(如 DJS 系列、757 机、“银河-I”),以及基于超大规模集成电路的计算机(如“银河-II”“曙光一号”“曙光 1000”)。由于国内发展电子计算机技术本身起步比国际上晚,再加上西方国家的封锁和禁运,这些机器的研制只能采取“全部采用国产器材,依靠自己的技术力量”的技术路线,大都耗费了较长的研制周期,研制成果也不可能实现商品化、产业化,但对打破国外的封锁都具有里程碑式的意义。“曙光一号”诞生后仅 3 天,西方国家便宣布解除 10 亿次计算机对中国的禁运。
打破垄断
随着国内各行各业对高性能计算的需求急剧增加并呈多样化,以及改革开放的浪潮,很多国外高性能计算机品牌(如 IBM、HP、SGI、SUN 等)涌入中国市场,这些国际巨头在民用市场形成了垄断地位。根据国家“863”计划的部署,智能中心承担起探索在改革开放条件下研制高性能计算机的新路的重任,做到“既要顶天,又要立地”。曙光机群高性能计算机在市场上的强力竞争,彻底改变了由国际大厂商制定的游戏规则,迫使国外大公司采取“跳楼价”。曾经在一段时间内,IBM 服务器在中国市场上的平均折扣已大到不可思议的 94%,即标价 100 万美元的服务器平均只卖 6 万美元。正是因为在技术和市场两方面都具备了能与国际巨头媲美的实力,对很多行业应用性能更高、价格更便宜、功耗更低,中科曙光成为国内第一家以高性能计算机为主业的上市公司。“神威”“天河”系列超级计算机通过建设国家超算中心,也服务了大量的高性能计算的用户。目前,高性能计算在我国科研单位、大学基本实现了普及。
引领创新
由于高性能计算机的“国之重器”的特殊属性,当中国的高性能计算机技术和产业水平发展起来后,西方国家开始从产业链条和技术层面进行遏制。一方面,在核心部件上“卡脖子”,如高性能处理器、高性能加速器、高性能互联芯片;另一方面,加快发展颠覆性的架构与核心技术。我国高性能计算的科技人员已经意识到这一严峻局势,决心走上引领创新之路。“曙光”“神威”“天河”都开始自主研制高性能处理器和加速器,用自己的核心部件构建世界上最快的计算机。2010 年 6 月,“曙光 6000”系统排名世界第二,从此开启中国高性能计算机持续占据超算排名前三甲的序幕。基于 Intel MIC 异构众核的“天河一”“天河二”系统和申威片内异构众核处理器的“神威·太湖之光”系统分别排名世界第一。基于“神威·太湖之光”超算系统上的应用获得了 Gordon Bell 奖。基于海光处理芯片的“曙光 8000”(Nebula-AI)的多个负载的实测性能也超过了排名世界第一的Summit。
在面向数据密集、人工智能、生物基因测序等新型应用上,智能中心发展了突破性的架构和关键技术。智能中心早在研制“曙光 4000”系统的时候就开始把数据密集型应用作为重要的负载,针对应用负载呈现的访存空间不规则、访存时间也不规则、计算-访存比低的科学问题,发展了高通量计算的基础理论、关键技术、核心芯片与整机系统。针对人工智能应用,发展了基于“寒武纪”神经网络处理器的智能超算系统,性能预计将冲击世界最高指标。