Google DeepMind發布DolphinGemma模型
1046
OpenAI 的GPT-4.5模型在剛剛發布後的六小時內,成功登頂人工智能競技場,並成為全任務分類的第一名。然而,這一榮耀並未持續太久,馬斯克的xAI Grok-3模型迅速逆襲,反超成為總榜第一名。
根據投票數據顯示,GPT-4.5與Grok-3各自獲得超過3000票,最終總分為1412對1411,僅差一分。儘管GPT-4.5在大多數項目上表現優秀,但Grok-3在特定的“帶風格控制” 和“困難提示詞” 任務上略有優勢,這使得它在總分上實現了反超。
對於這場“六小時逆轉”,不少用戶表示懷疑,認為如此迅速的變化是否合理。對此,有業內人士解釋稱,競爭榜單設有投票門檻,只有在同一時間內達到3000票的模型才能登上榜單。因此,剛剛發布不久的這兩款模型能夠同步達到該標準,是一場巧合的結果。
值得一提的是,儘管GPT-4.5剛發佈時面臨著一些負面評價,用戶對於其高情商的認可度卻在日後顯著上升。 OpenAI 的首席執行官薩姆・奧爾特曼甚至分享了與GPT-4.5的對話,表示這是他首次收到用戶請求其承諾不再下架該模型。
與此同時,GPT-4.5還在一項另類競賽中取得了優異表現,參與了一場類似於“大模型狼人殺” 的遊戲。在這場比賽中,各大AI 模型需進行辯論、策略制定與投票,最終的勝者由被淘汰的成員組成的陪審團決定。 GPT-4.5在合作、欺騙及策略制定等方面展現出超越人類的優秀表現。
這一切都表明,人工智能的競爭愈加激烈,各大模型在各自領域內不斷創新、提升。未來,誰將最終贏得這場智能之戰,值得我們持續關注。