OpenAI于2月5日发布公告,正式推出GPT-5.3-Codex,宣称这是其迄今为止性能最强的AI智能体编程模型。
在多项基准测试中,GPT-5.3-Codex展现了卓越实力。在SWE-bench Pro(公开版)测试中,该模型得分56.8%,小幅超越前代的56.4%;在Terminal-Bench 2.0测试中,其得分从前代的64.0%大幅提升至77.3%;在OSWorld-Verified智能体计算机操作基准测试中,得分从38.2%飙升至64.7%,这一显著进步表明其在复杂环境下的操作能力实现了质的飞跃。官方数据显示,该模型不仅在编程基准测试中屡创新高,运行速度也比前代GPT-5.2-Codex提升了25%。
OpenAI致力于将GPT-5.3-Codex打造成更优秀的开发者协作工具。新模型支持用户在任务执行过程中进行“引导与交互”,且不会导致上下文丢失。在Codex应用中,模型会高频更新工作进度,允许开发者实时提问、讨论方案并修正方向。官方博文指出,Codex正从单一的编程智能体演变为更通用的计算机协作者,这将大幅降低应用构建的门槛。
目前,GPT-5.3-Codex已全面向ChatGPT付费用户开放,涵盖Plus、Team及Enterprise等订阅计划。用户可通过Codex应用、命令行工具(CLI)、IDE扩展插件及网页端立即访问,API版本也将在近期上线。 |