DeepSeek升級並開源V3.1版線上模型
MoneyDJ新聞 2025-08-20 11:14:57 新聞中心 發佈 綜合港媒及陸媒報導,中國人工智慧(AI)企業深度求索(DeepSeek,簡稱DS)於昨晚(19日)宣布其線上模型版本已升級至V3.1,新版本的上下文長度拓展至128k,且增強版本已準備好進行測試。此外,DeepSeek同時於Hugging Face上開源了新模型 V3.1-Base。
新模型擁有更長的上下文窗口,這意味著DeepSeek能一次性記住和處理更長的文本內容,對長文檔分析、代碼庫理解、長對話保持一致性都更有幫助。DeepSeek暫未介紹模型的具體細節,但已將模型文件上傳至Hugging Face,不過目前僅開源了未經指令微調的基礎模型,其配置文件、腳本代碼和模型權重均可供下載。
值得關注的是,DeepSeek的次世代AI模型「R2」仍沒有確定的發布時間。在此之前,據英國金融時報(FT)引述消息人士指出,中國當局鼓勵其採用華為Ascend而非輝達(Nvidia)系統來訓練R2;而持續發生的技術問題,仍促使DeepSeek改以輝達晶片訓練模型,華為晶片則僅用於AI推論任務,為R2無法如期於5月發布的主因。
(圖片來源:shutterstock)
*編者按:本文僅供參考之用 ,並不構成要約、招攬或邀請、誘使、任何不論種類或形式之申述或訂立任何建議及推薦,讀者務請運用個人獨立思考能力,自行作出投資決定,如因相關建議招致損失,概與《精實財經媒體》、編者及作者無涉。
|
|
|
|