中文(繁體)

目前位置: 首頁> AI 資訊

OpenAI 的o3 模型在2024 國際信息學奧林匹克競賽中斬獲金牌

作者: LoRA 時間: 2025年02月13日 933

近期,OpenAI 發布了一項關於其最新推理模型o3的研究,展示了大型語言模型(LLM)如何從初學者的競賽程序員成長為全球頂尖水平的競爭者。 o3在著名編程平台CodeForces 上取得了2724的評分,位於前99.8% 的百分位,表現相當出色,並在2024年國際信息學奧林匹克(IOI)中獲得了金牌級別的成績。

OpenAI

研究表明,o3模型在IOI 比賽中超越了專門為此活動微調的o1-ioi 模型,這一結果表明,通過強化學習取得的成就要優於手工設計的解決方案。在IOI2024賽事中,o3在標準條件下參與競爭,成功地跨越了金牌的門檻。同時,它在CodeForces 上也躋身全球前200名程序員之列,能夠與頂尖人類程序員展開角逐。

來自沃頓商學院的副教授Ethan Mollick 表示:“通過強化學習發展起來的通用推理能力,現已超過了那些經過精心設計的領域特定解決方案。與其為特定任務構建專門的系統,不如通過更強的推理能力來讓大型通用模型實現更優的結果。”

此次研究是OpenAI 對其模型在競爭編程和更廣泛軟件工程領域表現進行評估的一部分。此外,另一家公司Anthropic 也在本週一發布了一份關於AI 對職場影響的報告。報告指出,約36% 的職業在至少25% 的工作任務中使用了AI,而57% 的AI 應用則提升了人類的能力,43% 的應用則專注於自動化。儘管如此,只有4% 的職業中,AI 被用於至少75% 的工作任務。

這項研究還表明,軟件開發和技術寫作是AI 應用的主要領域,而在涉及與環境進行物理互動的任務中,AI 的作用則相對較小。