OpenAI 的o3 模型在2024 國際信息學奧林匹克競賽中斬獲金牌

作者: LoRA 時間: 2025年02月13日 963

近期，OpenAI 發布了一項關於其最新推理模型o3的研究，展示了大型語言模型（LLM）如何從初學者的競賽程序員成長為全球頂尖水平的競爭者。 o3在著名編程平台CodeForces 上取得了2724的評分，位於前99.8% 的百分位，表現相當出色，並在2024年國際信息學奧林匹克(IOI)中獲得了金牌級別的成績。

OpenAI

研究表明，o3模型在IOI 比賽中超越了專門為此活動微調的o1-ioi 模型，這一結果表明，通過強化學習取得的成就要優於手工設計的解決方案。在IOI2024賽事中，o3在標準條件下參與競爭，成功地跨越了金牌的門檻。同時，它在CodeForces 上也躋身全球前200名程序員之列，能夠與頂尖人類程序員展開角逐。

來自沃頓商學院的副教授Ethan Mollick 表示:“通過強化學習發展起來的通用推理能力，現已超過了那些經過精心設計的領域特定解決方案。與其為特定任務構建專門的系統，不如通過更強的推理能力來讓大型通用模型實現更優的結果。”

此次研究是OpenAI 對其模型在競爭編程和更廣泛軟件工程領域表現進行評估的一部分。此外，另一家公司Anthropic 也在本週一發布了一份關於AI 對職場影響的報告。報告指出，約36% 的職業在至少25% 的工作任務中使用了AI，而57% 的AI 應用則提升了人類的能力，43% 的應用則專注於自動化。儘管如此，只有4% 的職業中，AI 被用於至少75% 的工作任務。

這項研究還表明，軟件開發和技術寫作是AI 應用的主要領域，而在涉及與環境進行物理互動的任務中，AI 的作用則相對較小。

OpenAI 的o3 模型在2024 國際信息學奧林匹克競賽中斬獲金牌

Manus邀請碼申請攻略

Character.AI 推出AvatarFX：AI 視頻生成模型讓靜態圖片“開口說話”

Manychat完成1.4億美元B輪融資，借AI加速全球社交電商佈局

谷歌AI概覽嚴重衝擊SEO點擊率：Ahrefs研究顯示流量下降超34%