OpenAI競爭對手推首款混合推理模型,稱是其有史以來最智慧模型
宋佳楠 / 何渝婷編譯
2025-02-25 10:35

(取自Anthropic官網)

當地時間2月25日,人工智慧新創公司Anthropic宣布推出旗下首款混合推理模型Claude 3.7 Sonnet。該公司表示,這是其有史以來「最智慧」的AI模型,也是市面上唯一的此類「混合」模型。

該模型具備即時響應能力,還能展示分步驟的詳細思考過程,為用戶提供更加靈活和高效的服務。

Claude 3.7 Sonnet最大的亮點在於其獨特的混合推理模式,它融合了標準思考和擴展思維兩種模式。

標準思考模式下,模型無需複雜推理過程,能立刻給出答案,滿足用戶對於簡單問題的快速獲取需求。

而在擴展思維模式中,模型會展示詳細的推理思維鏈,用戶可清晰看到模型如何逐步分析問題、應用邏輯,這種模式在數學、生物等科研領域以及複雜編程任務中尤為適用。

API用戶還可以對模型的思考時長進行精細化控制,在速度和回答品質間自由權衡。

相比其他模型,Claude 3.7 Sonnet在處理複雜程式碼庫和高級工具使用等方面有顯著改進,在專門評估AI解決真實軟體問題能力的SWE-bench Verified基準測試中,Claude 3.7 Sonnet達到了產業領先水準;同時,該模型在TAU-bench測試中也表現突出。

就在一週前,馬斯克號稱「地球上最聰明」的Grok 3也吸睛無數,與Grok 3相比,Claude 3.7 Sonnet的優勢在於其混合推理模式帶來的靈活性,Grok 3則在特定任務(如推理、數學競賽)上有不錯的發揮。

從基準測試結果來看,Claude 3.7 Sonnet(擴展思維版)適用於強邏輯推理和數學任務,而Grok 3 Beta在部分特定任務上表現更佳,兩者各有優勢。

Anthropic是一家在人工智慧領域迅速崛起的新創公司,其核心團隊成員不少來自OpenAI。

Anthropic的聊天機器人Claude與OpenAI的ChatGPT競爭激烈,此次推出的Claude 3.7 Sonnet,也被視為Anthropic在與OpenAI競爭中贏得優勢的重要舉措。

此前,Anthropic在產品發表上已多次贏得先機,例如率先推出「代理」功能,OpenAI隨後也跟進了類似舉措。

據媒體報導,眼下Anthropic正與Lightspeed和Google洽談一筆高達20億美元的融資,若融資成功,加上亞馬遜對該新創企業約80億美元的投資,其估值將達到600億美元。

另有消息稱,Anthropic擬籌集高達35億美元的資金,融資成功後估值將提升至615億美元。

這也表明,儘管AI領域競爭激烈,但投資者對頂級人工智慧公司需求依然強勁,看好其未來發展潛力。

本文為界面新聞授權刊登,原文標題為「OpenAI競爭對手推首款混合推理模型,稱是其有史以來最智能模型