OpenAI发布GPT-5-Codex:可独立编程7小时,代码审查、重构全搞定

AI 文章1周前更新 小编
0 0 0

刚刚,OpenAI放了个大招——GPT-5-Codex上线了!这可不是简单的“代码助手升级”,而是真正能当程序员用的智能体。

凌晨一点,OpenAI悄悄发布这个新模型,名字听着像GPT-5的兄弟,其实它是专门为编程任务深度优化过的版本。说白了,就是让AI不仅能写代码,还能独立完成整个开发流程:从功能开发、测试编写、调试到大规模重构,甚至帮你审代码找漏洞。

这个AI到底有多强?7小时不睡觉干活!

最猛的一点是:它能在没人干预的情况下,自己跑超过7个小时,不断试错、改bug、跑测试,最后交出一套可用的代码。你没听错,不是几分钟的小打小闹,是真的能“坐下来”啃一个复杂项目。

ad

程序员导航

优网导航旗下整合全网优质开发资源,一站式IT编程学习与工具大全网站

而且它不只是埋头苦干。OpenAI说,GPT-5-Codex特别擅长“听话”。你只要告诉它:“我要加个登录功能,支持邮箱和Google登录”,它就能自己搞定,根本不用你手把手教它怎么命名变量、用什么框架风格。

相比原来的GPT-5,它在真实工程场景下的表现更稳、更准。比如在两个硬核测试里——一个是SWE-bench Verified(专门考软件工程能力),另一个是Code Refactoring Tasks(代码重构)——它的准确率都超过了标准版GPT-5。

有意思的是,这次OpenAI终于把SWE-bench的全部500个任务都测了一遍,不像以前只测477个(被吐槽过偷懒)。他们解释说之前是因为有些任务跑不动,现在基础设施搞定了,全量测试也通过了。

审代码比人还细?真不是吹

很多人关心:AI写的代码靠谱吗?别急,GPT-5-Codex不止会写,还会“挑刺”。

ad

AI 工具导航

优网导航旗下AI工具导航,精选全球千款优质 AI 工具集

它的代码审查能力已经强到可以主动发现关键漏洞。比如你在GitHub提了个PR,Codex会自动分析:

  • 你的改动有没有偏离目标?
  • 是否影响了其他依赖模块?
  • 能不能正常运行?有没有潜在安全问题?

它甚至会自己跑代码和测试来验证结果,这种操作,通常只有最资深的工程师才会做。

OpenAI内部已经在用这玩意儿审大部分PR了,每天能揪出几百个问题——很多都是人工还没开始看就被拦下来了。开发者反馈说,现在合并代码心里踏实多了。

你可以直接在PR里喊一声@codex review,它就会上线分析;要是想查安全漏洞,还能加一句@codex review for security vulnerabilities,精准打击。

全平台覆盖,无缝切换本地和云端

现在,GPT-5-Codex已经全面接入Codex的所有使用场景:

  • 命令行工具(CLI)
  • IDE插件(VS Code、Cursor等)
  • 网页端
  • 移动设备
  • GitHub集成

也就是说,不管你是在本地写代码,还是在云上跑任务,都能无缝切换,上下文不会丢。Plus、Pro、Business这些订阅用户都已经包含这项服务。

ad

免费在线工具导航

优网导航旗下整合全网优质免费、免注册的在线工具导航大全

而且,它支持上传图片!比如你扔一张UI设计图或bug截图进去,它能看懂,生成前端页面后还会自己打开浏览器预览,再把效果截图发回来给你确认。

CLI和IDE插件也大升级

这次不光是模型变强,工具链也全面进化。

新的Codex CLI(命令行工具)做了重设计,支持:

  • 直接传截图、线框图建立上下文
  • 自动生成待办清单,跟踪进度
  • 接入web搜索和MCP工具
  • 终端输出更清晰,代码差异一目了然

权限控制也更灵活,分三种模式:

  1. 只读:改文件前必须你点头
  2. 自动:工作区内自由发挥,外面还得审批
  3. 完全访问:有网就能跑命令(高风险,慎用)

IDE插件也一样强大,在VS Code里就能直接调用Codex,提示词不用写太长,因为它会自动读取你当前打开的文件和选中的代码片段。

怎么保证安全?沙箱+权限控制双保险

AI乱执行命令怎么办?OpenAI早就想到了。

默认情况下,Codex运行在沙箱环境里,网络访问关闭,避免它偷偷下载恶意软件或者删你文件。所有危险操作都会先问你:“我要运行这条命令,OK吗?”

你还可以自定义安全策略:

  • 限制只能访问可信域名
  • 控制是否允许网页搜索
  • 决定要不要连MCP服务器

官方也强调:Codex是辅助工具,不能替代人工审查。每个任务完成后,它都会提供引用来源、日志和测试结果,方便你复查。

另外,在生物、化学这类高风险领域,GPT-5-Codex依然被划为“高能力级别”,并采取额外防护措施,防止滥用。

发布才两小时半,流量干到40%!

这玩意儿一上线就炸了。发布两个半小时后,山姆·奥特曼(Sam Altman)兴奋地宣布:GPT-5-Codex的流量已经占到整个Codex体系的40%,预计当天就会成为主力模型。

有人调侃:“这是自从切片面包发明以来最好的东西。”虽然听着夸张,但看得出来大家是真的买账。

那要多少钱?现在免费送,以后可能收费

目前,Codex已经包含在ChatGPT的各种订阅中:

  • Plus / Edu / Business用户:每周能搞几次集中编程会话
  • Pro用户:撑得住一整周多个项目的开发量
  • Enterprise企业版:共享积分池,按需分配

不过API还没开放,暂时没法通过API Key调用。但OpenAI说了:“很快(soon)就会推出API。”


总结一下,GPT-5-Codex不是一个“更好用的代码补全工具”,而是一个能独立承担软件工程任务的AI搭档。它既能快速响应小需求,也能长时间自主处理复杂项目,还能帮你把关代码质量。

换句话说,未来的程序员,可能真的要和AI一起“上班”了。

© 版权声明

相关文章

暂无评论

暂无评论...