OB电竞-浪潮信息“元脑SD200”超节点实现单机内运行超万亿参数大模型

2025-09-24 12:53:42

科技日报记者 操秀英

8月7日,海潮信息发布面向万亿参数年夜模子的超节点AI办事器“元脑SD200”。该产物基在海潮信息立异研发的多主机低延迟内存语义通讯架构,以开放体系设计向上扩大(Scale up)撑持64路本土GPU芯片。“元脑SD200”可实现单机内运行超万亿参数年夜模子,并撑持多个领先年夜模子机内同时运行和多智能体及时协作与按需挪用,今朝已经实现商用。

简朴来讲,超节点是一个经由过程GPU互联技能实现的超年夜计较体系。之前一台办事器算一个节点,超节点则把多个节点优化组合于一路,它将多台办事器、多张算力芯片卡整合为范围更年夜、算力更强的总体算力单位,冲破传统算力部署的界限。这类聚归并非简朴的硬件重叠,而是经由过程优化节点内互联技能、液冷散热等手腕,晋升集群总体能效、通讯带宽与空间使用效率。

海潮信息副总司理赵帅阐发,当前,混淆专家模子的高效架构正于驱动年夜模子参数范围连续扩大,海内外前沿年夜模子的参数目快速冲破万亿范围,这给算力体系架构提出新的挑战。一方面,模子参数目增长及序列长度增长带来的键值缓存激增,需要智能计较体系具备超年夜显存空间承载,依赖单芯片或者节点的机能晋升已经难以为继。另外一方面,智能体AI开启多模子协作的新范式,其推理历程需要天生比传统模子多近百倍的数据词元,致使计较量激增。

传统算力架构已经难以满意高效、低耗、年夜范围协同的AI计较需求,行业亟须一场技能改造。“于此配景下,财产界转向构建超节点以和财产链多个环节协同立异方式来解决当下算力需求。”赵帅说。

“元脑SD200”超节点基在开放总线互换技能构建,乐成解决了万亿年夜模子对于超年夜显存空间及超低通讯延时的焦点需求。于开放架构之上,“元脑SD200”经由过程智能总线治理及开放的预填充—解码(PD)分散推理框架实现软硬件深度协同,智能化治理繁杂AI计较使命。

“优异的软硬件协同能力是海潮信息的上风。”赵帅说,“元脑SD200”超节点AI办事器经由过程软硬协同体系立异,乐成向上扩大冲破芯片机能界限,于年夜模子场景中展示出优秀的机能体现。联合优化的PD分散框架,SD200超节点满机运行DeepSeek R1全参模子推理机能超线性晋升比为3.7倍,满机运行Kimi K2全参模子推理机能超线性晋升比为1.7倍。

当前,开源模子的奔腾式前进正于加快智能时代的到来,鞭策研发范式从关闭走向开放协作,年夜模子参数目的连续晋升,对于算力基础举措措施的设置装备摆设提出了更高要求。“海潮信息经由过程开放体系架构立异,为开源年夜模子的范围化落地及运用立异提供要害支撑。”赵帅说,超节点的搭建需要利用年夜量高速毗连器、高速线缆、板材等产物。“经由过程动员上下流相干技能的立异冲破及运用,鞭策形成更好的财产生态,进而提高生态竞争力。”赵帅说。

(勾当主理方供图)

-OB电竞

分享