中国跌出超算神坛?这下美日韩又被打脸了

壹零社科技宅 2024-11-22 04:27:23

一年前,全球超级计算大会正式公布了第62期全球超级计算机TOP500排行榜,美国橡树岭国家实验室的Frontier仍保持着第一名位置,中国的神威·太湖之光和天河二号A跌出前十,那一年,老美扬言:“中国超级计算机已经跌落神坛!”

01

“天河”新一代摘下桂冠

谣言不攻自破

来自国家超级计算天津中心的消息,中国“天河”新一代超级计算机系统,在最新公布的国际Graph500排名中,以6320.24 MTEPS/W的性能夺得Big Data Green Graph500(大数据图计算能效)榜单世界第一!

中国超算摘下该项桂冠后,曾经那些关于“中国超算不行了”的唱空言论开始不攻自破,而故事还要从一年前的11月谈起。

2023年,11月14日,全球超级计算大会正式公布了第62期全球超级计算机TOP500排行榜,美国橡树岭国家实验室的Frontier仍保持着第一名位置,并且仍是目前参加排名的超级计算机当中唯一的百亿亿次级超算。中国的神威·太湖之光和天河二号A也进入了前十五,分别排名第11和第14。

需要注意的是这一次排名中,美国一口气包揽了前三的位置,而排名第四的是日本的富岳超级计算机,HPL分数为442.01 PFlop/s,基于富士通自研的基于Arm架构的 48 核处理器A64FX,总共装有大约16万个CPU芯片。

在前十五的超级计算机当中,来自中国的神威·太湖之光超级计算机排名第11,其HPL分数为93.01 PFlop/s;天河二A的HPL分数为53.96 PFlop/s,排名第14。这个两个中国的超级计算机的排名相比之前再度下滑。

而在2022年的排名中,日本富岳超算登顶TOP500排名第一,美国Summit和Sierra超算稳住亚季军。

2023年这一榜单的出现,也让不少海外网友扬言:“中国超级计算机已经跌落神坛!”

除了占据前三名以外,美国在全球前十名中还有四台超级计算机,分别是第七名、第九名和第十名。这一数据再次验证了美国在超级计算机领域的强大实力。

尤其是在具体数据方面,中国的超级计算机神州太湖之光和天河二号在最新排行榜中的表现并不理想,分别位居全球第十一和第十四名。太湖之光的HPL性能为93.01PFlop/s,只相当于排行榜第一名Frontier的十分之一,落后明显。而天河二号的HPL性能为53.96PFlop/s,更是远远落后于前列。

连续两年的排名,让不少国内科技粉感到沮丧和担忧,“中国超算衰落了吗”“中国超算跌出神坛,美国封锁成关键”等声音更是不绝于耳。

事实上,我国超算排名之所以下滑,同我国保密策略有一定关系。

中国超级计算机排名低,是因为自2020年之后,中国便不再提供最新的数据。

同样,因为我国主动“齐赛”,在前天发布的 TOP500 超级计算机榜单中,前十依旧没有我国超算的身影。

虽然中国不再向全球超级计算机TOP500榜单提交数据,但国内仍在不断更新和优化超级计算机的性能和算力。此外,中国还通过其他渠道和方式发布国内超级计算机的排名和性能数据,在第六届中国超级算力大会上,就揭晓了“2024中国高性能计算机性能TOP100排行榜”和“2024国际人工智能性能AIPerf500排行榜”。

“天河”新一代本次夺冠的Graph500排行榜于2010年首次发布,是国际上评价超级计算机图计算性能的最权威榜单,主要针对当前热门的数据密集型应用,如人工智能、大数据处理等实施评测,可充分体现超级计算机的访存和通信性能,直接反映超级计算机的数据处理能力。

Graph500排行榜包含多个榜单,Big Data Green Graph500是其中的一项,用来评价超算在图计算中的能耗水平。

02

算力主权化

各国疯狂“砸钱”超算

美国终止核试验的底气就来自于其成熟的超算模拟核试验技术——超算是衡量一个国家科技实力和综合国力的重要标志。它不仅是高科技领域的战略制高点,也是国家科技竞争力的重要体现。超算的发展水平在一定程度上代表了一个国家的科技发展水平,是国家综合国力的重要标志之一。

超算在航空航天、天体物理研究、气象预报、潮汐预报等国家重大科技项目中发挥着不可替代的作用,在具体应用方面,通过超算,科学家可以模拟宇宙大爆炸、天体碰撞、气候变化等复杂现象,为科学研究提供数据支持。此外,超算还用于基因组学研究、药物分子设计、行星模拟等尖端科学领域。

通过高性能计算能力,科学家可以模拟宇宙大爆炸、天体碰撞、气候变化等复杂现象,为科学研究提供数据支持。此外,超算还用于基因组学研究、药物分子设计、行星模拟等尖端科学领域。在飞行器空气动力学、核电站安全性和城市交通拥堵预测等方面,超算也展现出巨大价值。

而超算在医学影像处理、基因测序分析等领域也有广泛应用。利用其高速计算能力,医生可以更快速地进行疾病诊断和治疗规划,提高医疗水平。特别是在生物医药领域,超算加速了药物研发和疾病模型模拟。

除应用领域广泛外,超算的核心竞争力在于其强大的算力,这种算力来源于高性能处理器(如GPU、TPU)、高速互连网络和高效算法。超算算力主要用于尖端科学领域的计算,比如行星模拟、基因分析、药物分子设计等。

超算本身是算力的一种高级表现形式,代表着算力的顶尖水平。它通过高度优化的硬件架构和并行计算技术,实现了前所未有的计算速度和数据处理能力。因此,可以将超算视作算力的一个子集,是为了解决特定领域内最复杂、最数据密集型问题而专门构建的高算力平台。

由于投入巨大、回报周期较长,各国的超算项目主要由政府实施或资助。如今,超算技术和资源水平已经成为一国科研实力的重要指标之一。

美国能够长期在全球超算Top 10里占据多个席位,同其持续海量投入有莫大关系。2024财年,美国提出了高达2100亿美元的研发预算申请,虽然该预算涉及多个领域,但超算作为关键技术之一,也获得了相应的资金支持。

具体到超算相关的机构,美国能源部(DOE)的科学办公室就将预算提高9%,达到88亿美元,其中聚变能源科学研究获得了显著增长,用于支持包括超算在内的相关研究。

NITRD(国家信息技术研发机构)的人工智能研发投资预算在2024财年增长到31亿美元,较前一财年提高了19.2%,虽然这是人工智能领域的预算,但超算作为支撑人工智能发展的重要基础设施,也从中受益。

除了联邦政府的投入外,美国各州政府和私营企业也对超算研发给予了大力支持。全球首富埃隆·马斯克(Elon Musk)旗下的人工智能新兴企业xAI,在极短的时间内就部署了当前世界上规模最大、速度更快的超级计算机“巨像”(Colossus),该超级计算机配备了10万颗GPU,专门用于人工智能模型的训练。

除美国外,日本这几年能够在全球超算排行榜上取得不错的成绩,背后自然也同政府鼎力支持有关。

日本曾计划于2021~2022年推出新一代百亿亿次超算,整个项目耗资大约1300亿日元(约合79亿元人民币),用于替代即将退役的“京”超算。而在2023、2024年度超算排行榜前十榜上有名的“富岳”,则是由日本理化学研究所和富士通公司联合设计制造,陆陆续续已经投入约1300亿日元(约合12亿美元或79亿元人民币)。

而面对全球AI浪潮,日本宣布计划于2025年开始建造全球首台“泽级”(Zetta,意为数量级10^21)超级计算机。该项目的建造成本可能超过7.5亿美元,预计将于2030年完全投入使用。一旦完全投入运行,其峰值运算速度将达到10^21次浮点运算/秒,为当时世界最强大超级计算机的1000倍。

据初步估算,日本文部科学省已为项目的第一年预留了大约42亿日元(2900万美元),但整个项目可能会拨款高达1100亿日元(7.61亿美元)。

除整体超算外,富士通发布了将搭载到日本下一代国产超级计算机上的新型CPU(中央处理器),并计划通过核心零部件CPU的实用化,推动日本下一代超级计算机的发展。

值得一提的是同样处于亚洲的韩国,同样在超算上不遗余力的投入。

据韩国科学技术研究院 KISTI 官网,其下辖机构韩国超高性能计算委员会本月 4 日批准了对韩国第 6 代国家超级计算机(6 号机)的规划变更,KISIT 也在本月 7 日公布了“6 号机”的初步规格。

韩国目前的“5 号机”超算名为Nurion,2018 年起服役。这台超算硬件上采用了英特尔至强融核 Xeon Phi 处理器和英特尔 Omni-Path 100Gbps 互联网络,理论峰值算力(Rpeak)达 25.71 PFlop/s,Linpack 性能(Rmax)达 13.93 PFlop/s,排在 2024 年 6 月期 TOP500 榜单的第 75 位。

而 KISTI 对“6 号机”的初步规划是 600 PFlop/s 的 Rpeak 算力,这一数值高于目前在 TOP500 上位居第四的日本“富岳”超算。

“6 号机”将放弃韩国前 5 代国家超级计算机的纯 CPU 方案,转向以 GPU 为主,其将基于每节点包含 4 个 GPU 的 GPU 分区和每节点 2 个通用 CPU 的 CPU 分区,同时采用 400Gbps 互联网络,存储容量也将达 200PB—— 相当于“5 号机”的 10 倍。

结合 KISTI 官方新闻稿和韩联社报道,“6 号机”超算本应于 2025 年推出,早期预算规模为 2929 亿韩元(当前约 15.18 亿元人民币),但由于 AI 热潮导致 GPU 需求爆炸式增长,GPU 价格也飞速上升,2023 年 5~11 月的多轮招标均以失败告终,KISTI 因此修改了超算建设计划,这或许也是非常尴尬的事情。

03

四十五年砥砺前行

我国超算自主之路

1978年,在全国科学技术大会上,邓小平一句“中国要搞四个现代化,不能没有巨型机”,开启了自研超级计算机的历史进程。计算机专家慈云桂在接到超级计算机研制任务的时候,就立下军令状。“拼上这条老命也要把中国的巨型计算机搞出来”,这是当年他的豪言壮语,掷地有声。

上个世纪60年代,全球最先进的计算机都掌握在老美手中,开出一台700万美元的天价,我国技术落后只能咬牙求购,老美为了遏制我国发展,扬言“绝不卖给中国!”

20世纪70年代末,随着改革开放的深入,中国面临着能源开发、气象应急等国家发展的迫切需求,但当时国内缺乏超级计算机,相关数据不得不送到国外处理,不仅费用高昂,而且受制于人。

1983年,我国第一台亿次超级计算机“银河一号”研发成功,使中国成为继美国、日本之后第三个能够独立设计和制造超级计算机的国家。然而,“银河一号”的运算速度与美国相比仍有较大差距,中国超算依然处于世界一流的边缘。

进入21世纪,中国超算迎来了加速追赶的时期。2009年,“天河一号”千万亿次超级计算机研制成功,使中国成为世界上第二个成功研制千万亿次超级计算机的国家。2010年,“天河-1A”在第三十六届全球超级计算机TOP500排行榜中名列第一,标志着中国超算实现了从跟跑到并跑的历史性跨越。

此后,中国超算不断取得新的突破。2013年,“天河二号”以每秒5.49亿亿次的峰值性能登顶TOP500排行榜,并实现六连冠的佳绩。2016年,“神威·太湖之光”以每秒12.54亿亿次的峰值性能接棒登顶,进一步巩固了中国超算在世界领先地位,而后“天河二号”和“神威·太湖之光”等国产超级计算机在国际超级计算机大赛上多次问鼎冠军,实现了世界超算“十连冠”。

而在大众关注的国产化方面,事实上,“神威·太湖之光”超算在包括处理器在内的所有核心部件上实现了全国产化,展示了我国在超算技术方面的自主研发能力。

具体落地到芯片方面,不少核心元器件的确属于保密状态,但我国也公布了一些大众格外关心的超算部件来源。

以处理器为例,目前我国自主研发的超级计算机已经采用了国产处理器。“神威”E级超算原型机就采用了具有完全自主知识产权的申威众核处理器。

“神威”E级超算原型机的网络交换芯片也实现了国产化,采用了完全自主知识产权的申威网络芯片构建高速互连网络系统。

同时,经过多年的发展,我国超算在消息处理芯片等核心器件方面也实现了国产化。

值得一提的是新一代国产超级计算系统“天河星逸”也采用了国产先进计算架构、高性能多核处理器、高速互连网络、大规模存储等关键技术构建,进一步提升了国产化率,且截至2023年,我国共有14座国家级超算中心,这些中心采用的超级计算机大多都实现了较高的国产化程度。

04

剑指未来算力争霸

E级超算

新兴技术迭代日新月异,此前美日均已经公布研制出“E级超算”(百亿亿次/秒),扬言在中西超算竞速中拿下第二局。

E级超算是指每秒可进行百亿亿次(即10^18次)数学运算的超级计算机,代表了当今全球计算能力的巅峰水平,被公认为“超级计算机界的下一顶皇冠”。

目前,全球多个国家和地区都在积极研发E级超算。美国橡树岭国家实验室的新型超算“前沿”(Frontier)在2022年5月30日发布的全球超算TOP500榜单中,以压倒性优势成为全球最快超算,也是全球首台正式发布的E级超算。

此外,日本、欧洲等地也在积极研制E级超算,但尚未有正式发布的消息。在中国,神威E级计算机的研发工作也在进行中,虽然目前尚未有正式发布的E级超算,但中国在高性能计算领域已经取得了显著的进展和成果。

我国同样在在E级超算的研发上持续投入,国家“十三五”高性能计算专项课题中,中科曙光、国防科技大学和江南计算技术研究所分别牵头研制了神威、天河和曙光三台E级超算原型机系统,并已全部完成交付并部署在多个超算中心。这些原型机系统使用了国产处理器和自主研发的关键技术,如神威系统采用申威众核处理器,天河系统集成飞腾ARM架构芯片,曙光系统则采用海光X86处理器。

E级超算不仅在性能上具有巨大的提升,还在能耗、可扩展性、可靠性等方面面临前所未有的挑战。现有技术下的超算功率高达千兆瓦,需要专门的核电站供电,其中超过50%的功耗来源于数据的搬运。此外,E级超算还需要解决高运行频率下的实时校验需求和控制系统规模的问题。

但E级超算在科学研究(物理、化学、生物)、工程开发(航空航天、汽车制造、能源)、商业(金融、保险、医疗)等领域又有极大作用,让各国不得不持续投入,毕竟E级超算的研发不仅是各国科技实力的象征,也是解决能源危机、气候变化等重大问题的关键工具。

而中国和美国等国家都在积极推进E级超算的研发,并通过不断的技术创新和优化,逐步实现这一目标。

0 阅读:94