出品:科普中国

作者:杨超(中国科普作家协会)

监制:中国科普博览

上篇文章中,我们了解了“神威·太湖之光”曾是世界上最快的超级计算机,代表着中国在算力领域的一次重大突破。但很多人不知道,它的真正核心,不是庞大的机房设备,而是一颗中国“芯”——申威处理器。

一台超级计算机跑得快,并不稀奇;能靠自己造跑得快的芯片,才是真本事。这背后的故事,是中国从“能用超算”到“能造超算”的关键一步。本篇文章,我们就聚焦于这颗中国自主设计的芯片——SW26010。

SW26010芯片

(图片来源:国家超级计算无锡中心)

“超算的大脑”:我国自主研发的申威处理器

申威不是一台机器,而是一种国产高性能处理器的统称。尤其是在“神威·太湖之光”这台超级计算机中,所采用的正是名为SW26010的申威处理器。换句话说,“申威”是“神威”的大脑,是驱动这台超级计算机完成千万亿次运算的计算核心。

这颗芯片是中国自主研发、完全不依赖国外架构授权的处理器,具有以下几个关键特点:每颗SW26010芯片包含260个计算核心,包括256个运算核心和4个管理核心,整个神威系统共搭载了40960颗芯片,总计超过1065万个计算核心。

芯片采用“低频高并行”策略,适合高效执行大规模科学计算任务。“低频高并行”指的是不追求单个处理器核心的高主频,而是通过集成大量低频核心来实现整体计算能力的提升。相比传统的“高频少核”方案,这种方式能显著降低能耗和发热,提升系统的能效比。

SW26010架构以及从核阵列结构逻辑示意图

(图片来源:国家超级计算无锡中心)

SW26010-Pro**:升级版“中国芯”**

在SW26010的基础上,我国还研发出了SW26010-Pro处理器,它是“神威·太湖之光”后续型号超级计算机所使用的核心芯片。

与SW26010相比,SW26010-Pro在计算性能、存储带宽、能效比、指令集兼容性和编程友好性等方面都有明显提升。W20610-Pro由6个核心组和1个协议处理单元组成,每个核心组包含64个计算处理元素,总计384个内核,而SW26010只有4个核心组,并且每个核心组都有自己的内存控制器,**理论带宽达到了307.2GB/s,**解决了上一代中某些核心互联与内存访问瓶颈,提升了多核之间的数据传输效率。

此外,它还增强了对异构计算架构的支持,更适配未来大规模并行任务的需求。

我们为什么要自研处理器?

在“神威”使用“申威”的那一刻起,中国迈出了超算领域关键的一步:不再依赖国外芯片,而是走上了自主可控的道路。那么,为什么自研处理器这么重要?原因可以归结为四个层面:

**1.**避免“卡脖子”风险

曾几何时,中国的超级计算机系统使用的芯片常从国外进口。但在2015年,美国政府限制向中国出口高性能计算芯片,使得“天河二号”升级计划被迫中止。正是这一事件,直接促使“神威·太湖之光”全面转向国产处理器“申威”。自研芯片,不仅是技术能力,更是“算力主权”的保障。

**2.**满足国家战略需求

超级计算机不只是科研工具,它是涉及国防安全、气候预测、能源开发等多个关键领域的“科技基石”。如果关键芯片依赖进口,一旦被封锁,整个系统将面临瘫痪风险。唯有自主研发处理器,才能确保国家最核心的科研和安全任务顺利进行。

**3.**节能高效、针对性强

国外通用芯片是为“泛用途”设计的,即采用通用计算架构,旨在适应广泛的、多样化的计算需求,而非专门针对某一特定领域优化。而申威处理器从一开始就专为高性能并行计算优化。它采用大量核心、低频协同的架构,适合大规模科学模拟、复杂工程仿真等任务,在能耗控制和并行效率上具有明显优势。申威并不追求“单核最快”,而是追求“整体最适合超算”。

总之,自研“申威”,不仅仅是为了实现自主可用,更是为了摆脱受制于人的困境,掌握技术发展的主导权。“神威”的超强算力令人惊叹,但更令人自豪的,是“申威”这颗完全自主的“中国芯”。从芯片到整机,从被动使用到自主设计,我们不只是造出了一台超级计算机,更迈出了自主可控、掌握核心技术的坚实一步。真正的算力强国,不仅要跑得快,更要掌握方向盘。

不过,硬件的强大仅仅是起点,真正的价值在于它如何将算力转化为解决实际问题的“超级力量”。这样一台配备自主研发的芯片、具有强大算力的超级计算机,到底有什么具体的用途呢?我们将在下一篇文章揭晓。

参考文献:

[1] 胡怡, 陈道琨, 杨超, 等. 国产 SW26010-Pro 处理器上 3 级 BLAS 函数众核并行优化[J]. 软件学报, 2023, 35(3): 1569-1584.

来源: 中国科普博览

内容资源由项目单位提供