華為推AI技術Flex:ai,單卡可切分承載多項負載
MoneyDJ新聞 2025-11-21 16:40:29 新聞中心 發佈 綜合港媒及陸媒報導,華為今(21)日下午舉辦「2025 AI容器應用落地與發展論壇」,並發布AI容器軟體Flex:ai,該技術透過算力切分技術,將單張GPU/NPU算力卡切分為多份虛擬算力單元,切分粒度精準至10%,實現了單卡同時承載多個AI工作負載,並可聚合集群內各節點的空閒XPU算力聚合形成「共享算力池」。據悉,Flex:ai將在發布後同步開源於魔擎社區中。
AI容器本質是將AI模型及其依賴環境(框架、庫、配置)打包為獨立可執行單元,基於Docker/Kubernetes等技術實現「一次建構,處處運行」。
在此之前,據報導指出,華為AI容器技術Flex:ai將對標輝達(Nvidia)於去(2024)年底收購的以色列公司Run:ai的核心技術,意在透過軟體創新,實現輝達、昇騰及其他三方算力的統一資源管理與利用,「屏蔽」算力硬體差異,為AI訓練推理提供更高效的資源支撐。
華為公司副總裁、數據儲存產品線總裁周躍峰於論壇邀請函中表示,AI產業邁入深水區,算力資源的利用效率問題逐漸突顯;華為始終堅持AI領域創新,積極探索「以軟體補硬體」的途徑,攻破AI產業發展瓶頸。此次發布並開源創新AI容器技術Flex:ai,希望與業界共探以AI容器技術為載體的資源高效利用新模式。
報導並指出,該技術延續「以軟體補硬體」的創新思路,可將GPU、NPU等算力資源利用率從行業平均30%-40%大幅提升至70%,顯著釋放算力硬體潛能。
*編者按:本文僅供參考之用,並不構成要約、招攬或邀請、誘使、任何不論種類或形式之申述或訂立任何建議及推薦,讀者務請運用個人獨立思考能力,自行作出投資決定,如因相關建議招致損失,概與《精實財經媒體》、編者及作者無涉。
|