北大團隊提出LIFT框架:將長上下文知識注入模型參數
232
在最近的一期播客中,OpenAI 的首席产品官凯文・维尔(Kevin Weil)表示,人工智能有望在今年底之前在性编码基准测试中超越人类程序员。凯文回顾了近年来人工智能的快速发展,强调了 AI 编码模型的显著进步。
瓦伦提到,根据 Anthropic 的相关研究,功能性代码预计到2027年将实现99% 的自动化。Anthropic 的 Claude3.5Sonnet 和 OpenAI 的 GPT-4o、o1模型都是当前表现最优秀的 AI 编码模型之一。Anthropic 还推出了 Claude Code,这是一款可以让开发者直接从终端中委托编码任务的工具,旨在自动化软件开发过程的部分环节。
凯文认为,随着推理模型的不断改进,编码能力也会自然提升。他提到,OpenAI 的 o1模型在发布时在竞争性编码基准测试中的排名约为百万名,而在推出其首个编码模型时,o1的排名约为全球千名。OpenAI 即将推出的 o3模型目前的排名已经提升到全球第175名。
凯文表示,随着接续模型的训练,性能也在不断提升。他认为,今年至少在竞争性编码基准测试中,AI 将会超过人类程序员。此外,凯文还分享了他对 AI 快速发展的看法、GPT-4.5的类人特征、未来工作的变化,以及对 GPT-5的预期时间表,并透露了他的一些创业想法,讨论了 AI 如何革命教育和民主化软件创建。