阿里雲Aegaeon方案助攻資源效益 GPU用量減82%
MoneyDJ新聞 2025-10-20 10:59:27 新聞中心 發佈 綜合陸媒報導,近日,阿里巴巴(BABA.US;9988.HK)旗下阿里雲提出的計算池化解決方案「Aegaeon」成功入選頂級學術會議SOSP 2025,該方案可解決AI模型服務中普遍存在的GPU資源浪費問題,核心技術已應用於百煉平台。在測試中,該系統削減GPU用量82%,降低硬體成本,並允許單個GPU動態服務於多個不同的AI模型,打破了以往GPU與特定模型綁定的低效模式。
據悉,在阿里雲模型市場進行的為期超過三個月的Beta測試中,「Aegaeon」系統展現了卓越的效能。測試數據顯示,服務數十個參數量高達720億的大模型,所需的輝達(Nvidia)H20 GPU數量從1,192個成功減少至213個,數量削減高達82%。
|
|
|
|