7月4日消息,摩爾線程公司日前宣佈其AI旗艦產品——誇娥(KUAE)智算集群解決方案實現重大技術升級,成功將集群規模從千卡級別擴展至萬卡規模。
這也意味著摩爾線程在國產通用加速計算平臺領域邁出瞭重要一步,為國內AI技術的發展提供瞭強大的基礎設施支持。
誇娥萬卡智算集群以全功能GPU為底座,具備萬P級浮點運算能力,專為處理萬億參數級別的復雜大模型訓練而設計。
這一解決方案不僅大幅提升瞭計算性能,還實現瞭超大顯存容量和超高速卡間互聯總帶寬,為AI模型訓練提供瞭堅實的算力基礎。
摩爾線程誇娥智算集群的核心特性包括超大算力、超高穩定性、極致優化和全能通用性,集群的平均無故障運行時間超過15天,周均訓練有效率在99%以上。
此外,通過系統軟件、框架和算法的優化,誇娥萬卡集群實現瞭高效率訓練,MFU(模型訓練效率)最高可達60%。
此次升級還特別強調瞭生態友好性,誇娥萬卡集群支持多種大模型架構,基於MUSA編程語言和完整兼容CUDA能力,提供瞭高效易用的生態適配工具,加速新模型的遷移和業務上線。
此外,摩爾線程還與中國多傢知名企業就萬卡集群項目進行瞭戰略簽約,共同構建好用的國產GPU集群。
發表評論 取消回复