MoneyDJ新聞 2025-08-14 13:41:28 郭妍希 發佈
市場謠傳,中國AI新創DeepSeek的次世代AI模型「R2」之所以無法如期於5月發布,主要跟使用華為「Ascend」系列處理器進行訓練有關。
英國金融時報(FT) 14日引述未具名消息人士報導,DeepSeek 1月發表AI模型「R1」後,當局鼓勵其採用華為Ascend而非輝達(Nvidia Corp.)系統來訓練R2。然而,持續發生的技術問題,仍促使DeepSeek改以輝達晶片訓練模型,而華為晶片則僅作AI推論任務之用。這些問題是R2無法如期於5月發布的主因。
業內人士透露,跟輝達產品相比,華為晶片面臨穩定性問題,不但晶片間互聯(inter-chip connectivity)速度較慢,軟體效能也屈居劣勢。
據兩名消息人士說法,華為派了一組工程師進駐DeepSeek辦公室,助其使用旗下AI晶片開發R2。然而,即便有工程團隊駐點,DeepSeek依舊無法成功以Ascend訓練模型。DeepSeek還在跟華為想辦法,看要如何讓R2模型跟Ascend處理器相容,以完成AI推論任務。
此外,根據消息,數據標記(data labelling)耗費的時間比預期久,也是R2延宕的原因。據陸媒報導,R2最快再過幾週就有望問世。
市場日前才剛傳出,中國當局呼籲當地企業避免使用輝達的「H20」繪圖處理器(GPU),尤其是在涉及政府相關的用途之際。除了輝達外,北京當局推行的政策,也對超微(AMD)的AI處理器造成影響,但不清楚是否有任何函件提及AMD的「MI308」。
北京當局才剛召見輝達代表,討論美國的定位追蹤技術以及據信跟H20晶片有關的安全風險。輝達安全長David Reber 8月5日透過官方部落格回應中國指控H20有「後門」安全風險的疑慮,直指輝達GPU並未內建緊急停止開關(kill switch)或後門。
(圖片來源:shutterstock)
*編者按:本文僅供參考之用,並不構成要約、招攬或邀請、誘使、任何不論種類或形式之申述或訂立任何建議及推薦,讀者務請 運用個人獨立思考能力,自行作出投資決定,如因相關建議招 致損失,概與《精實財經媒體》、編者及作者無涉。