Tags

5 个页面

codex

Codex 的 goal,不是多一条命令,是把“做到什么算完”抬成一等公民

最近看 Codex 的 goal,最容易让人误会的一点,不是它会不会写代码,而是它为什么像能在终端里自己接力干活。你给它一句目标,它不是回你一段话就结束,而是能继续改、继续测、继续修,跑上几个小时。

新东西其实不在“更自动”,而在它开始把“做到什么算完”当成一等公民。

OpenAI 在 2026-05-21 把 Goal mode 正式推到 Codex app、IDE extension 和 CLI。Claude Code 这边也已经有官方 /goal 页面,而且实现口径写得更直白。两家终端现在都在往同一个方向收敛:把 agent 从“等你每轮喂一句话”改成“围着一个完成条件持续推进”。这篇就把这件事拆开讲清楚。

token 更少,为什么 GPT-5.5 在 Codex 里反而更贵了

傻眼了。

ChatGPT 官方这边一直不太好直接看 token 和费用,我就找了个三方平台,在 Codex 里拿 GPT-5.4 和 GPT-5.5 跑了一轮同类任务,思考模式都拉到 high。结果很直白,简单问题还算温和,GPT-5.5 比 GPT-5.4 大概贵了 30% 左右;一上复杂任务,费用直接干到 2.6 倍,连请求次数和 token 消耗都一起往上走。

我现在的判断也很直白:这不是一句“5.5 单价更贵”就能说完的事。简单问题里,贵主要贵在单价;复杂任务里,贵的其实是整条调用链。但是反过来看,5.5 也确实更像是在替你吃掉返工成本。模型更愿意多想、多做、多检查几步,最后账单不是按一句回答算,而是按整套动作算,人也少来回折腾几轮。

Codex 默认 medium,我后来还是切到 high

用 Codex 这段时间,有个问题一直挺别扭:默认思考档位是 medium,但网上一聊到 GPT-5.4,口气又都很猛。真到自己手里,mediumhighxhigh 到底差多少,官方也没给一张特别直白的表。

我现在的结论挺明确,日常编码我更愿意直接开 highmedium 不是不能用,快活、小修小补、试探方向没问题;但真到多文件修改、需求有歧义、还要边看代码边判断的时候,medium 很容易把算力省错地方。xhigh 我反而不会常开,留给卡壳的大活更合适。

Skill 不是新提示词,它是给 agent 配工种手册

这几天看 AI 编程,前脚大家还在聊 MCP,后脚又开始聊 Skill。很多人第一次看到这个词,会本能地把它当成又一个新协议,或者又一种高级提示词。

我的判断很直接,Skill 不是来抢 MCP 位置的,它更像是给 agent 配一份工种手册。MCP 解决的是“让 agent 能连上外部世界”,Skill 解决的是“连上以后,按什么套路把活干稳”。这两者不是替代关系,更像是一前一后。

说白了,MCP 让 agent 有手有脚,Skill 让 agent 别乱来。

低价 API 中转站的终局:三月份的大模型体验与不可能三角

整个三月份,我都在不同的大模型 API 中转站之间来回试。

便宜,确实是便宜。一个月花不了多少钱,就能把 ChatGPT、Claude、Gemini 之类的国外模型都摸一遍,表面上看,像是找到了一个性价比极高的解法。但真正用下来以后,我越来越觉得,这条路从一开始就绕不开一个不可能三角:质量、稳定、划算,三者很难同时成立。

到了上周末,这件事基本也算彻底明牌了。2026-03-282026-03-29 这两天,ChatGPT 相关通道的风控体感明显收紧,Claude 这边也一样,很多原来还能凑合用的低价中转,突然就变得不稳定,甚至直接失效。对我来说,这基本宣告了低价 API 中转模式的阶段性终局。