小米開源首個推理大模型Xiaomi MiMo

MoneyDJ新聞 2025-04-30 11:44:26 記者新聞中心報導

綜合陸媒報導，小米(1810.HK)今(30)日正式宣布，開源首個為推理(Reasoning)而生的大模型「Xiaomi MiMo」，從連動預訓練到後訓練，全面提升推理能力。據悉，MiMo是來自全新成立不久的「小米大模型Core團隊」的初步嘗試。

據了解，Xiaomi MiMo在數學推理(AIME 24-25)和代碼競賽(LiveCodeBench v5)公開測評集上，MiMo僅用7B的參數規模，超越了OpenAI的閉源推理模型o1-mini和阿里巴巴(9988.HK)Qwen更大規模的開源推理模型QwQ-32B-Preview。

官方表示，MiMo推理能力的提升，由預訓練和後訓練階段中數據和演算法等多層面的創新聯合驅動，在預訓練方面，核心是讓模型見過更多推理模式；在數據方面，著重挖掘富推理語料，併合成約200B tokens推理數據；在訓練方面，進行了三階段訓練，逐步提升訓練難度，總訓練25T tokens；在後訓練方面，核心是高效穩定的強化學習演算法和框架。

在演算法方面，提出Test Difficulty Driven Reward來緩解困難演算法問題中的獎勵稀疏問題，並引入Easy Data Re-Sampling策略，以穩定RL訓練；框架方面，設計了Seamless Rollout系統，使得RL訓練加速2.29倍，驗證加速1.96倍。

MoneyDJ理財網		財經知識庫	基金頻道		iQuote	ETF頻道	美股頻道
資訊新聞台股美股港股基金未上市美債金融專題報導　個人理財 ETF iQuote 潛力產品多空訊號　財經台	學習技術學院經濟學院選股學院會員中心加入會員查詢密碼個人存摺購物理財商品手機版 +粉絲團	分類研究報告新聞財經百科股票市場市場動態個股情報產業分析國家動態熱門產業總體經濟	財經基金新聞　研究報告國際金融　資訊境內基金　境外基金　搜尋境內\|境外進階搜尋區域搜尋商品搜尋　境內外基金搜尋	排名公會排名週轉率排名基金報酬排行基金評等基金龍虎榜　四四三三趨勢軌跡工具投資藏寶圖	走勢分析多空瞭望銀行匯率市場動態基金總覽市場觀點	ETF介紹 ETF發行公司 ETF基本資料 ETF資金流向 ETF投資策略 ETF相關分析 ETF搜尋區域\|類型進階\|指數 ETF排名漲幅\|跌幅規模\|成交量點閱人氣排行 ETF工具 ETF大車拼 ETF成本評比 ETF主題投資	個股資料基本資料行情報價基本分析排行漲幅排行跌幅排行超買排行超賣排行成交量排行點擊排行查詢次數排行工具 ADR套利選股工具行事曆各類股績效表現