阿里推通義團隊迄今能力最強模型Qwen3-Max
MoneyDJ新聞 2025-09-24 13:53:13 新聞中心 發佈 綜合陸媒報導,阿里巴巴(9988.HK)今(24)日推出Qwen3-Max,係通義團隊迄今為止規模最大、能力最強的語言模型。該模型總參數超過1T,預訓練使用了36T tokens,沿用了Qwen3系列的架構設計。據悉,Qwen3-Max-Instruct的預覽版在LMArena文本排行榜上位列第三,超越了GPT-5-Chat。正式版本在代碼能力和智慧體(agent)能力方面進一步提升,在涵蓋知識、推理、編程、指令遵循、人類偏好對齊、智慧體任務和多語言理解的全面基準測試中均達到業界領先水準。
此外,Qwen3-Max-Instruct在SWE-Bench Verified測試中取得69.6分,穩居全球頂尖模型之列;在評估智慧體工具調用能力的嚴苛基準Tau2-Bench上,Qwen3-Max-Instruct更是實現了突破性表現,以74.8分超越Claude Opus 4與DeepSeek-V3.1。另外,Qwen3-Max的推理增強版本Qwen3-Max-Thinking,通過集成代碼解譯器並運用並行測試時計算技術,展現了前所未有的推理能力,尤其在極具挑戰性的數學推理基準測試AIME 25和HMMT上,均取得了滿分。
|
|
|
|