Loop engineering 把人挪到检查点
昨天参加 MiniMax 线下开发者大会,回来以后有个词一直没绕过去:loop engineering。
我一开始以为它只是把 agent 多跑几轮。这个理解太浅了。真正让我卡住的地方是,AI 写代码的速度已经比人审核代码的速度快太多,如果人的参与还停在“每一步都看、每一步都拍板”,那生产力最后会被人的检查速度锁住。
昨天参加 MiniMax 线下开发者大会,回来以后有个词一直没绕过去:loop engineering。
我一开始以为它只是把 agent 多跑几轮。这个理解太浅了。真正让我卡住的地方是,AI 写代码的速度已经比人审核代码的速度快太多,如果人的参与还停在“每一步都看、每一步都拍板”,那生产力最后会被人的检查速度锁住。
最开始我以为只是前端还没来得及收拾。strategy_studio 的业务逻辑一直在往前走:行情同步、PostgreSQL、异步回测、报告落库和研究工作台都陆续接上了,但页面看起来越来越像“功能先上车,界面后补票”。等我想让 Codex 直接破坏性重构 UI 时,问题才真正露出来:提示词越写越狠,界面还是像在旧格子里重新挪组件。
这几天看大模型公司的资本动作,很容易把两件事混在一起。
智谱和 MiniMax 都在往 A 股路径上推,Anthropic 已经向 SEC 保密递交 draft S-1,OpenAI 也被 Axios 报道正在准备 confidential IPO prospectus。几条消息摆在一起,像是这个行业终于到了收获期。
但上市窗口先打开,不等于利润窗口已经打开。大模型公司不是没有收入了,有些收入甚至跑得很快;真正还没普遍翻过去的,是净利润、经营现金流和持续模型投入这本账。
/goal 最容易被误解成一条“让 agent 多干一会儿”的命令。
这当然是它的表象。你给 Codex 一个目标,它可以围着这个目标持续推进,不是一轮回答完就停。但真正值得注意的不是“跑得久”,而是它把“做到什么算完”从一句临时提醒,变成了任务本身的一部分。
普通 prompt 说的是下一步要做什么。goal 更像给 agent 挂了一张验收单:目标是什么,边界在哪里,哪些验证必须通过,满足什么条件才可以收工。
整理 ChatGPT 以来的英伟达数据中心 GPU,不能只做型号清单。真正的变化是两条路线同时加速:一条追最高训练性能,一条追可卖、可交付、可合规的市场覆盖。
训练路线看的是 H100、H200、B200、GB200 这类旗舰产品。它们不断把算力、显存、带宽、互联和整柜方案往上推。大模型越大,单卡性能已经不够,系统级连接、集群效率和能耗控制变得更重要。
另一条路线是特供和区域合规版本。给中国市场的产品,不只是简单“阉割版”,而是在出口管制限制下,重新平衡性能、带宽、互联和可销售性。它们的意义不是代表最高技术,而是说明英伟达要在规则缝隙里保住客户和生态。
这几个月用 Claude、Codex 写代码,我最强烈的感受不是“程序员要没了”。
更准确的说法是,很多以前会丢给新人练手的活,现在 AI 能先打一版了。脚手架、小功能、测试、文档、边角 bug,以前这些活不算高级,但很适合把一个人从“会语法”磨到“知道工程怎么回事”。
对老手来说,AI 是提效工具。对新人来说,它更像把新手村拆短了。门没有关,但从入口走到能独立负责事情,中间能慢慢摔跤的地方变少了。
傻眼了。
ChatGPT 官方这边一直不太好直接看 token 和费用,我就找了个三方平台,在 Codex 里拿 GPT-5.4 和 GPT-5.5 跑了一轮同类任务,思考模式都拉到 high。结果很直白,简单问题还算温和,GPT-5.5 比 GPT-5.4 大概贵了 30% 左右;一上复杂任务,费用直接干到 2.6 倍,连请求次数和 token 消耗都一起往上走。
我现在的判断也很直白:这不是一句“5.5 单价更贵”就能说完的事。简单问题里,贵主要贵在单价;复杂任务里,贵的其实是整条调用链。但是反过来看,5.5 也确实更像是在替你吃掉返工成本。模型更愿意多想、多做、多检查几步,最后账单不是按一句回答算,而是按整套动作算,人也少来回折腾几轮。
开始我其实没想着测。刷到 OpenAI 在 2026 年 4 月 21 日发 ChatGPT Images 2.0 的新闻时,我的第一反应是,又一个图像版本更新。直到我瞅了眼 Artificial Analysis 的榜单,GPT Image 2 (high) 已经排到文本生成图片第一,Elo 1332,我就有点意难平,还是去试了几轮。
结果挺直接,中文效果很好,漫画也能做,连续多张图的角色和叙事稳定性也上来了。但我后面越试越觉得,这次真正值得写的不是“它更会画了”,而是“它开始让一些原来默认可信的东西变得不太可信了”。这件事比排行榜更麻烦。