
隨著人工智慧技術的蓬勃發展,各大科技公司不斷加碼其AI產品的推廣和技術創新。2025年3月25日,谷歌在其開發者平台Google AI Studio正式推出了全新的AI推理模型系列——Gemini 2.5。這一系列模型特別強調其在回答問題之前可以“思考”的能力,標誌著AI技術進入了全新的階段。
Gemini 2.5 Pro Experimental是谷歌此次推出的新系列中的旗艦產品,該模型以其超強的多模態推理能力被公司描述為目前最智能的模型。它提供的月訂閱計劃為20美元,用戶可以透過Gemini應用和Google AI Studio來使用這一新功能。谷歌官方表示,未來所有新推出的AI模型將都具備推理能力,這反映出谷歌在AI領域的走向,即希望不僅僅是提供資訊,而是能夠進行深度的邏輯推理。
自從OpenAI在2024年9月推出首個AI推理模型以來,整個科技業界都在努力追趕其技術領先地位。如今,Anthropic、DeepSeek、谷歌與xAI等公司都推出了各自的AI推理模型。這些模型利用額外的計算能力來進行事實檢查和推理,以在提供答案之前考量其他因素。這樣的推理技術在數學和編碼任務中實現了質的飛躍。許多專家認為,推理模型將是未來AI代理的關鍵組成部分,能夠在很大程度上實現自主任務執行,從而減少對人類的依賴,然而,這也意味著其運行成本會顯著提高。
谷歌此前曾嘗試開發推理型AI模型,在2024年12月發布了“思考”型的Gemini版本。而此次Gemini 2.5則是其對抗OpenAI“o”系列最認真的嘗試。根據谷歌的說法,Gemini 2.5 Pro在多項基準測試中超越了之前的AI模型,包括作為代碼編輯測試的Aider Polyglot中,獲得了68.6%的評分,這一數據很明顯地高於了OpenAI和其他公司所推出的推理型AI模型。然而,在另一項測試中,Gemini 2.5 Pro在測量軟體開發能力的SWE-bench Verified中,獲得了63.8%的評分,相對於Anthropic的Claude 3.7 Sonnet 70.3%的評分依舊有所不足。
除了推理能力之外,Gemini 2.5 Pro還具備一個引人注目的功能:它配備了一個擁有100萬個token上下文窗口的能力,這意味著模型能在一次性輸入中處理大約75萬字的內容,這一字數甚至超過了《指環王》系列整個作品的篇幅。谷歌表示,未來將支持達到200萬token的輸入長度,這不僅顯示出其模型處理繁複信息的能力,亦為用戶提供了更大的靈活性。
這一新推出的Gemini 2.5 Pro還未公布API的定價,谷歌承諾在未來幾周內會發佈更多的資訊。隨著推理技術在各行各業的應用潛力不斷被挖掘,未來的發展勢頭令人期待,而AI將如何改變我們的工作與生活方式,也將成為科技界的又一熱議話題。期待在不久的將來,Gemini 2.5所展現的神奇能力,為我們的生活帶來哪些顯著的變化。 來源: TechCrunch
參考資料:Google unveils a next-gen family of AI reasoning models – TechCrunch