MoneyDJ新聞 2025-09-30 08:22:40 賴宏昌 發佈
CNBC報導,亞馬遜(Amazon.com, Inc.)支持的人工智慧(AI)新創企業Anthropic週一(9月29日)發表最新AI模型「Claude Sonnet 4.5」、獲業界基準測試SWE-bench Verified評為「全球最強編碼模型」。
Claude Sonnet 4.5能夠自主運行長達30小時、遠勝今年5月問世的Claude Opus 4(7小時)。估值高達1,830億美元的Anthropic表示,Sonnet 4.5在整個運行期間能夠專注於複雜的多步驟任務。
Anthropic是在去年10月宣布向軟體開發者發布AI代理公開測試版。Anthropic當時表示,這項名為「電腦使用(Computer Use)」的新功能讓AI可以像人類一樣透過電腦完成複雜任務。
根據Anthropic週一發布的新聞稿,Claude Sonnet 4.5在專門測試AI模型執行真實世界電腦操作任務的基準測試(OSWorld)中、以61.4%的得分高居榜首。相較之下,Sonnet 4在4個月前是以42.2%居首。
依據SWE-bench Verified的代理人編碼(Agentic coding)評比,Claude Sonnet 4.5以77.2%的準確率居首,贏過GPT-5 Codex的74.5%以及Gemini 2.5 Pro的67.2%。
Business Insider報導,Anthropic執行長Dario Amodei在9月4日發布的BBC專訪中表示,許多企業執行長私下都將AI視為削減成本的工具,他們當中有很多人都希望藉此削減成本、減少人力。
根據招聘平台Indeed日前發布的「生成式人工智慧(GenAI)技能轉型指數」,在將近2,900項工作技能當中、軟體開發最有可能被GenAI所改變。
華爾街日報8月報導,SignalFire合夥人Heather Doshay指出,Anthropic目前是AI求職者最常提及的夢幻企業,因為Anthropic推出的Claude模型其編碼能力長期以來廣受開發者社群的歡迎。
(圖片來源:Anthropic)
*編者按:本文僅供參考之用,並不構成要約、招攬或邀請、誘使、任何不論種類或形式之申述或訂立任何建議及推薦,讀者務請運用個人獨立思考能力,自行作出投資決定,如因相關建議招致損失,概與《精實財經媒體》、編者及作者無涉。