電子發燒友網綜合報道 近年來,超節點隨著人工智能技術的面向模型迅猛發展,尤其是涌現大模型的興起,對算力的超節點需求呈現出爆發式增長。在這一背景下,面向模型紫光股份旗下新華三集團以“算力×聯接”為技術基石,涌現重磅發布了全新的超節點H3C UniPoD系列超節點產品,旨在為萬億級參數大模型的面向模型訓練與推理提供更強勁、更智能且更綠色的涌現算力支持。
H3C UniPoD系列超節點產品基于領先的超節點Scale-up南向互聯技術,可實現單機柜最高64卡GPU間的面向模型高速互聯互通,有效突破了單卡計算性能瓶頸,涌現為AI技術在百行百業的超節點落地應用提供了堅實的算力基礎。
當前,面向模型以DeepSeek為代表的涌現MoE大模型持續火爆,推動了AI領域的“軍備競賽”,大模型已邁入“萬億級”時代。然而,傳統的計算架構和“摩爾定律”已不再適用,單卡計算性能接近天花板,單機GPU互聯及機間Scale-out橫向擴展也難以滿足高帶寬、低時延與高可靠的集群網絡聯接需求。新華三憑借在網絡聯接領域的深厚積累,結合不同品牌GPU的性能與架構特點,開發出基于以太協議和PCIe協議的雙技術路線超節點產品,可實現單機柜最高64卡的全互聯互通,大幅提升單節點計算效能,打造了萬億級參數大模型訓推的強勁算力引擎。
本次發布的H3C UniPoD超節點產品以算力芯片多元化、互聯協議標準化、基礎設施集成化為核心設計理念,主要涵蓋H3C UniPoD S80000和H3C UniPoD F80000兩個子產品系列,能夠為不同規模參數的模型訓練、推理和精調提供有針對性的算力支撐。
H3C UniPoD S80000面向萬億級參數模型訓推場景,實現了更高性能、更高密度、更高效率的三重進化。它以網強算,全面釋放算力矩陣動能,柜內卡間全互聯通信,互聯帶寬提升8倍,單機柜訓練性能相較于單節點最高可提升10倍,單卡推理效率提升13倍。
在密度方面,H3C UniPoD S80000單柜支持部署64卡,采用液冷方式散熱,整柜功率可支持到120KW,同時兼容下一代高性能AI加速卡。此外,三總線全盲插、全面的漏液檢測等設計,簡化了運維流程、提升了能效產出。
值得關注的創新點是,H3C UniPoD F80000依托全國產算力平臺,采用創新的PCIe光互聯技術,突破單機板內走線限制,實現了64張AI加速卡的高速互聯,卡間帶寬大幅提升至576GB/s,模型訓練性能提升35%以上。基于靈活開放的產品理念,H3C UniPoD F80000支持基于不同形態的AI服務器及AI加速卡靈活構建超節點產品,支持按需定義產品拓撲16/32/64卡,實現靈活按需交付。
近年來隨著算力需求的增長,市場上出現越來越多的超節點產品。比如,NVIDIA NVL72系統配備72個NVIDIA Blackwell GPU,單個GPU顯存為192T;配置36個NVIDIA Grace CPU,每個CPU搭配480GB內存,總內存為17TB DDR5X;采用第五代NVLink技術,單GPU連接帶寬達1.8TB/s,整個系統內的72個GPU通過NVLink全互聯,總帶寬達130TB/s;采用全液冷機架方案,相比傳統風冷基礎設施,同等功耗下性能提升25倍。
華為昇騰 384 超節點由 12 個計算柜和 4 個總線柜組成,支持 384 張昇騰 910C NPU 全互聯,通信時延降低至 0.2μs(較傳統方案下降 10 倍),帶寬提升 15 倍。采用液冷設計,PUE<1.2,性能對標英偉達 NVL72 超節點。
燧原科技云燧ESL超節點系統單節點最高64卡全帶寬互聯,采用液冷方案,實現高性價比、高密度、高能效,可實現9216GB單節點存儲容量、230TB/s單節點存儲帶寬、51.2TB/s單節點聚合帶寬、單節點可支持PD分離優化。
展望未來,AI行業對算力的需求將持續增長。隨著大模型的不斷發展,算力基礎設施的性能、效率和靈活性將變得至關重要。新華三將持續深化“算力×聯接”能力,實現關鍵技術突破和工程化創新,全面構建多元開放、持續進化、AI就緒、強勁穩定的算力基礎設施,加速百行百業的智慧躍遷。多元算力架構的融合、高速互聯技術創新、綠色節能發展、智能化運維管理以及算力云服務的普及將成為未來行業發展的主要趨勢。
面向萬億級參數大模型,“超節點”涌現