中文(繁體)

目前位置: 首頁> AI 資訊

AI大戰超級瑪麗:Claude 3.7封神,GPT-4o表現欠佳

作者: LoRA 時間: 2025年03月04日 1041

誰是遊戲界真王者?AI 竟向經典遊戲《超級馬力歐兄弟》發起挑戰! 加州大學聖地亞哥分校Hao 人工智能實驗室傳來驚人戰報:在一場別開生面的AI “馬力歐” 大亂鬥中,Anthropic 旗下的Claude3.7模型“一騎絕塵”,力壓群雄,榮登“最強AI 馬力歐” 寶座! 緊隨其後的是同門師弟Claude3.5,而谷歌Gemini1.5Pro 和OpenAI 的GPT-4o 這兩位“AI 界大佬” 卻意外“翻車”,表現令人大跌眼鏡! 這究竟是怎麼回事?

這場AI “馬力歐” 爭霸賽, 並非在古老的紅白機上進行, 而是在一個“高科技” 模擬器中展開。 研究人員專門打造了一個名為GamingAgent 的框架, 作為AI 與遊戲世界的“橋樑”。 在這個虛擬世界裡, AI 化身“馬力歐”, 手握“遊戲手柄”, 接收來自系統的“作戰指令”: “前方有障礙!跳!”,“敵人來襲!躲!”, 指令簡潔明了, 卻也充滿挑戰。 系統還會“貼心” 地送上游戲截圖, 幫助“AI 馬力歐” “眼觀六路,耳聽八方”, 更好地“掌控” 戰局。 更酷的是, AI 竟然能“現場編寫” Python 代碼, 指揮“馬力歐” 做出各種“騷操作”, 上躥下跳, 躲避障礙, 簡直“秀” 到飛起!

image.png

然而, 賽場上的“戰況” 卻出人意料。 那些“身經百戰” 、 以“推理能力” 著稱的AI 模型, 比如OpenAI 的o1, 竟然“馬失前蹄”, 表現還不如一些“非推理型” 選手! 這是為何? 原來, “推理大神” 也有“致命弱點”—— “反應太慢”! 在《超級馬力歐兄弟》 這種“分秒必爭” 的實時遊戲中, “推理模型” 需要花費數秒鐘“深思熟慮” 才能“慢吞吞” 地做出決策, 但“戰機稍縱即逝”, 一秒鐘的“遲疑”, 就可能導致“馬力歐” “命喪黃泉”! 看來, 在瞬息萬變的遊戲世界裡, “反應速度” 才是“硬道理”!

儘管遊戲早已成為AI 競技的“重要舞台”, 但也有專家對此“另眼相看”。 在他們看來, 遊戲世界畢竟是“虛擬世界”, 與“真實世界” 相比, 還是“Too young, Too simple”! 遊戲環境“過於簡單” 和“抽象”, AI 可以從中“無限量” 地“刷經驗值”, 積累“理論數據”, 但“紙上談兵終覺淺”, 這些AI 模型的“真實能力” 究竟如何, 還有待“實戰檢驗”。 OpenAI 的研究科學家安德烈・卡帕西甚至發出了“評估危機” 的“靈魂拷問”, 讓人不禁“陷入沉思”。

不過, 質疑歸質疑, 圍觀AI “花式玩轉” 超級瑪麗, 依然是一場“賞心悅目” 的“技術秀”, 它生動地展現了AI 技術的“日新月異”, 也為我們打開了一扇“窺探未來” 的“窗口”。 誰能想到, 曾經只能在“棋盤” 上“運籌帷幄” 的AI, 如今也能在“遊戲世界” 裡“大顯身手”? 或許在不久的將來, AI 真的能“統治” 遊戲界, 甚至“超越” 人類玩家, 成為“遊戲界” 的“真·王者”! 讓我們拭目以待!