GPT-4.5六小時榜首之爭：Grok-3逆襲登頂

作者: LoRA 時間: 2025年03月04日 201

OpenAI 的GPT-4.5模型在剛剛發布後的六小時內，成功登頂人工智能競技場，並成為全任務分類的第一名。然而，這一榮耀並未持續太久，馬斯克的xAI Grok-3模型迅速逆襲，反超成為總榜第一名。

根據投票數據顯示，GPT-4.5與Grok-3各自獲得超過3000票，最終總分為1412對1411，僅差一分。儘管GPT-4.5在大多數項目上表現優秀，但Grok-3在特定的“帶風格控制” 和“困難提示詞” 任務上略有優勢，這使得它在總分上實現了反超。

對於這場“六小時逆轉”，不少用戶表示懷疑，認為如此迅速的變化是否合理。對此，有業內人士解釋稱，競爭榜單設有投票門檻，只有在同一時間內達到3000票的模型才能登上榜單。因此，剛剛發布不久的這兩款模型能夠同步達到該標準，是一場巧合的結果。

值得一提的是，儘管GPT-4.5剛發佈時面臨著一些負面評價，用戶對於其高情商的認可度卻在日後顯著上升。 OpenAI 的首席執行官薩姆・奧爾特曼甚至分享了與GPT-4.5的對話，表示這是他首次收到用戶請求其承諾不再下架該模型。

與此同時，GPT-4.5還在一項另類競賽中取得了優異表現，參與了一場類似於“大模型狼人殺” 的遊戲。在這場比賽中，各大AI 模型需進行辯論、策略制定與投票，最終的勝者由被淘汰的成員組成的陪審團決定。 GPT-4.5在合作、欺騙及策略制定等方面展現出超越人類的優秀表現。

這一切都表明，人工智能的競爭愈加激烈，各大模型在各自領域內不斷創新、提升。未來，誰將最終贏得這場智能之戰，值得我們持續關注。