电视剧
flash 源码(OpenAI最强编程模型登场,实测竟又被Gemini 3 Flash按趴下)
OpenAI最强编程模型登场,实测竟又被Gemini 3 Flash按趴下nerror="javascript:errorimg.call(this);">

编译 | 王欣逸

智东西12月19日消息,今日凌晨,OpenAI发布最新编程模型GPT-5.2-Codex,该模型基于GPT-5.2,对智能体编程能力进行了深度优化,具体包括:提升了长程任务执行、大规模代码变更、兼容Windows环境以及网络安全防御等能力。OpenAI在博客中称这是他们迄今为止最强的编程模型

OpenAI最强编程模型登场,实测竟又被Gemini 3 Flash按趴下nerror="javascript:errorimg.call(this);">

OpenAI已率先在Codex CLI、IDE扩展、云端以及代码审查中发布了GPT-5.2-Codex,今日起已向所有付费ChatGPT用户开放,API访问也即将上线。

GPT-5.2-Codex的性能可能不及预期。有网友称,GPT-5.2-Codex在SWE-Bench Pro上性能提升不到1%,还没有发布SWE-Bench Verified结果,这不免让人推测GPT-5.2-Codex并未达当前最优水平,在一些系统卡基准测试中还出现了性能退步。

OpenAI最强编程模型登场,实测竟又被Gemini 3 Flash按趴下nerror="javascript:errorimg.call(this);">

GPT-5.2-Codex在实际软件工程任务中的表现有所提升,包括了代码库导航、重构、Pull Request的创建与审查等方面。

据OpenAI官方博客,在网络安全领域,GPT-5.2-Codex在夺旗挑战(CTF)中创下所有模型的最佳纪录。从折线轨迹来看,我们也能得出,就网络安全评估,OpenAI的模型能力正在持续提升。OpenAI博客称,他们正在全面升级网络安全防护,还引入可信访问机制来支持防御工作。

OpenAI最强编程模型登场,实测竟又被Gemini 3 Flash按趴下nerror="javascript:errorimg.call(this);">

结语:AI编程工具竞争加剧

在OpenAI本次更新之前,谷歌同日也发布了低成本的Gemini 3 Flash模型,AI编程赛道竞争持续激烈。就目前来看,号称OpenAI最强编程模型的GPT-5.2-Codex在现实场景中的实际效能、与竞争对手产品的比较表现或许不及预期,该模型的实际应用效果和性能检验或将成为接下来的焦点。

来源:OpenAI、X


顶一下()     踩一下()

热门推荐

发表评论
0评