新闻动态
在AI波澜的倾盆股东下,大模子的迅猛发展对算力提议了近乎尖酸的条目。万亿参数大模子与多模态考试的兴起,促使算力集群跑步迈入“万卡协同”期间。
传统算力架构已难以昂扬高效、低耗、大限制协同的AI考试需求,行业亟需一场工夫矫正。在此布景下,超节点(SuperPod)——这一由英伟达当先提议的Scale Up(纵向膨胀)经管决策,凭借其高性能、低资本、高能效等上风,赶紧成为环球科技巨头竞逐的“新战场”。
据中科院物理所先容,超节点的英文名叫SuperPod,是英伟达最先提议的认识。算作Scale Up确面前最优解,它通过里面高速总线互连,大约灵验撑合手并行策动任务,加快GPU之间的参数交换和数据同步,缩小大模子的考试周期。
在2025寰宇东谈主工智能大会时间,从华为昇腾384超节点的“真机首秀”,到曦智科技光互连决策的“SAIL奖折桂”,中国企业在超节点边界的全面吐花,不仅记号着算力集群认真迈入“万卡协同”期间,更预示着AI基础顺序的竞争已从单点打破升级为系统工程级的生态较量。
图片开首:新华社
超节点成AI算力“新宠”
超节点,究竟好在那里?
一般而言,构建大限制GPU集群,行业主要接收Scale Out(横向膨胀)以及Scale Up(纵向膨胀)两种神志。
有业内东谈主士指出,相较于传统决策Scale Out,Scale Up在性能、资本、组网、运维等方面存在上风。而超节点便是Scale Up的最好决策。
“超节点架构通过深度整合GPU资源,在超节点内构建起低延长、高带宽的调解算力实体,已成为撑合手这一演进的关节工夫旅途。”壁仞科技OCS超节点名堂关联负责东谈主董朝锋对21世纪经济报谈记者暗示。
“面前传统风冷AI就业器的功率密度已靠近极限。一个规范机柜塞满8张高功耗GPU就业器,其散热和供电挑战庞杂。”董朝锋指出。
在他看来,超节点通过液冷等先进散热工夫,将数十甚而上百个策动单位整合在一个高度集成的机柜或机组中,极地面擢升了算力密度和动力为止(PUE)。
中信建投研报对超节点商场远景合手乐不雅格调。其指出,超节点算作进攻的产业趋势,也曾被国表里稠密就业器选为下一代决策,同期大部分的超节点决策齐会接收铜连络算作主要承载载体。
面前,通讯采集聚常见的连络决策包括光通讯和高速电通讯,无源DAC算作电通讯的主要经管决策,不包含光电退换器模块,具有很高的资本效益和运营可靠性,成为杀青短距离传输的优秀经管决策。
当今的铜缆也曾杀青224G以太网SerDes高速通讯工夫升级,短距离传输性价比卓越,在AI就业器高集成度的趋势下,铜连络呈现一定的趋势放量。
面前,业界主流的超节点决策主要包括特有合同决策和通达组织决策两种,特有合同主要包括英伟达、Trainium决策、华为决策等。
“在英伟达决策中,GNVL72就业器接收大批的铜连络算作机柜里面通讯神志,GNVL72机柜中不同的策动托盘盘曲纳电缆进行互联,里面使用电缆长度累计接近2英里,共有5000多条孤独电缆。”上述研报指出。
而策动托盘内雷同接收大批铜连络算作就业器内的GPU芯片互联。在通达合同中,当今的通达规范不啻一个,基本上齐所以以太网工夫(ETH)为基础,以太网工夫最纯熟、最通达,也领有最多的参与企业。
超节点通达规范方面,中心建投指出,相比有代表性的是由通达数据中心委员会(ODCC)主导、中国信通院与腾讯牵头假想的ETH-X通达超节点名堂。在ETH-X的架构中,分为Scale Up和Scale Out两个主要组网部分,其中Scale Up鸠合负责HBD里面GPU之间的互联,HBD不错由一个或者多个高功率Rack构成,通过Scale Up进行膨胀;多个HBD通过Scale Out的膨胀神志构成更大的GPU集群。
值得在意的是,该机构提到,国内字节、阿里、腾讯新一代就业器鉴别接收超节点假想,预期将进一步带动铜连络合座商场空间。
科技企业纷纷布局
靠近超节点这一算力新边界,国内科技企业积极布局。
其中,华为在超节点边界进展显耀。本年5月23日,华为于鲲鹏昇腾开辟者大会上发布昇腾384超节点,杀青业界最大限制的384卡高速总线互联,具备超大带宽、超低时延、超强性能的三大上风。
在2025寰宇东谈主工智能大会上,华为初度展示了昇腾384超节点真机。
除了昇腾384以外,大会上,曦智科技聚合壁仞科技、中兴通讯推出环球首个散播式光互连光交换GPU超节点经管决策——光跃LightSphereX。
记者获悉,该超节点基于曦智科技散播式光交换工夫,接收硅光工夫的光互连光交换芯片和壁仞科技大算力通用GPU液冷模组等构建。
与此同期,曦智科技与沐曦合作的光互连电交换超节点决策也在会上初度公开亮相,进一步丰富了超节点的工夫门道。
而燧原科技的云燧ESL超节点系统,在测试中说明出雅致性能,单节点最高64卡全带宽互联,接收液冷决策,办法是高性价比、高密度、高能效。
而沐曦发布的旗舰GPU曦云C600,支合手MetaXLink超节点膨胀工夫,而且内置ECC/RAS多重安全驻扎模块。
此外,记者获悉,摩尔线程也曾竖立了涵盖AI考试智算卡、AI推理卡、AI超节点就业器及夸娥(KUAE)智算集群在内的全栈AI智算产物线。
在2025寰宇东谈主工智能大会召开前夜,摩尔线程独创东谈主兼CEO张建中提议构建新一代AI考试基础顺序,为AGI期间打造分娩先进模子的“超等工场”。
据张建中先容,这座“AI工场”的智能“产能”,由五大中枢身分共同决定,其为止公式可轮廓为:AI工场分娩为止=加快策动通用性×单芯片灵验算力×单节点为止×集群为止×集群理解性。
他指出,当单节点为止达到新高度,如何杀青大限制集群的高效诱骗成为新的挑战。摩尔线程自研KUAE策动集群通过5D大限制散播式并行策动工夫,杀青上千节点的高效诱骗,股东AI基础顺序从单点优化迈向系统工程级打破。
在业内东谈主士看来,当单点打破升维为体系化竞争力,中国超节点工夫正在为环球东谈主工智能发展铺设一条兼具性能与包容性的新赛谈开yun体育网,其价值有望合手续开释。