从Prompt到loop：AI范式四次跃迁，解放人类双手，Google主管却担忧token成本

转载于 2026-06-26 09:13:45 发布 · 15 阅读

从Prompt到loop：AI范式四次跃迁，解放人类双手，却也引发担忧

最近网上热传，老黄黄仁勋为AI新趋势画重点：“Prompt已死，loop当立”，即“现在根本没有人写Prompt了，新时代的核心工作是编写和管理loop”。loop直译是“循环”，在AI圈指设计一个系统，让系统替人给AI下指令、验收，不合格就重来，直到完成任务。

有人疑惑，这和如今的Agent有何区别？暂且按下不表，环顾发现，除老黄外，“龙虾之父”Peter、“Claude Code之父”Boris Cherny、吴恩达等大佬都在大力推广loop。Peter表示别再给编程Agent写提示词，去设计循环；Boris称自己已不给Claude写提示词，而是让循环给Claude下指令，自己的工作就是写循环。当“写loop”成为大佬们新日常，loop显然已越过“新概念”阶段，剩下的问题是：它具体是什么，为何突然火了？

loop到底是什么

要理解loop，需回顾之前的旧范式。过去两年，AI编程的标准动作是：人写prompt，AI吐代码，不满意就再写，AI再改，人需全程盯着。卡帕西曾吐槽“人就是瓶颈”，劝告大家把自己从流程中抽离。

而loop的核心逻辑是：人定义目标，AI自己运行、验收，不合格就带着报错重来，直到通过或撞上预算上限才停止。此时，人的角色从“传话人”变成“规则设计者”。

显而易见，Agent是干活的，loop是让Agent不用人盯着也能持续干活的管理机制。没有loop的Agent，需人提一句动一下，本质上还是工具；套上loop的Agent，才成为能自转的系统。

原理虽不复杂，但有点抽象。实际上，loop已藏在熟悉的系统里，产品落地层形成了“双雄对峙”格局。

一是Claude Code，围绕loop做了三件套：/loop负责定时循环，/goal负责目标驱动，/schedule负责云端定时任务。其中，/goal最精妙，它遵循“自己不能判自己的卷子”原则，写代码的是大模型，验收的是独立小模型Haiku，确保验收有真实约束力。

二是OpenAI Codex，玩法接近“自动化流水线+目标驱动+多个子Agent”组合，最多8个Agent可在各自云端沙箱并行工作，最后汇总结果。两家实现路径不同，但形态相似，都是拆碎任务，分给多个Agent并行处理，再统一汇总。公开评测和社区口碑显示，两者表现接近，说明模型差距不大，真正的差距在上层的loop编排。

“Claude Code之父”Boris Cherny自述，去年11月卸载IDE，如今手下几百个小Agent同时工作，有的扫GitHub issue，有的读用户反馈，有的监控CI失败。每个Agent在隔离代码分支干活，一个写代码，另一个跑测试验收，搞不定的才进他的收件箱。自Opus 4.5以来，他的代码都由Claude Code写，大部分在手机上完成。Agent之间互相提示，无需人工审核。可见，loop的终极形态是：人不写代码和prompt，只写规则和判断，其余交给loop。

怎么loop起来

X上的博主Codez总结了14步实操roadmap，以下是一些干货：

- step 1：先做“4条件测试”：loop不是什么活儿都能做，动手前需回答四个问题：任务是否重复发生、有无自动化验收手段、Token预算是否扛得住、Agent有无“高级工程师”的工具。四个全通过，才值得建loop。

- step 2：从最小可行loop开始：第一次建loop，做一个四件套：触发器（如Claude Code的/loop、Codex的Automations面板）、技能（将项目上下文写进STATE.md）、状态文件（用Markdown记录进度）、门禁（能自动拦住坏结果的测试、类型检查等）。顺序很关键，要先手动跑通一次，再写成Skill，包进loop，最后上定时。跳步是loop在生产环境失败的主要原因。

- step 3：做“拆卷子”的人，别做“判卷子”的：loop设计的重要原则是写代码和验代码的分开，用不同模型或子Agent负责，且验收的不能看到写代码的推理过程。因为模型给自己的代码打分往往“手太松”，独立验收器能挑出毛病。

- step 4：避免踩坑：一是设Token上限、迭代次数上限、时间限制，防止loop无限制运行；二是将Agent学到的东西写进状态文件，避免遗忘；三是不让loop碰架构重写、鉴权代码等需要判断的活，它适合干对错清晰、机器可验证的活；四是读Diff，避免“理解力债务”。

- step 5：衡量指标：唯一有用的指标是每个被接受的改动平均成本。若“被接受率”低于50%，说明loop在亏钱。

从提示词到loop，四次范式跃迁

loop Engineering概念不到三周，但它并非凭空出现，有清晰的演化路径：从Prompt→Context→Harness→loop，共四次。

2023 - 2024年是Prompt Engineering阶段，人们关注提示词怎么写才能让AI好好干活，“会不会写prompt”基本等于“会不会用AI”，人和AI关系表面，指令需人亲自敲。

2024 - 2025年，行业强调“Context Engineering”，关注点从“怎么问”变成“给AI看什么”，AI依赖整个背景，信息组织能力比写prompt更重要，控制粒度上移到“一堆信息”。

2025 - 2026年，Agent系统进入真实开发流程，人们发现光给信息和上下文不够，AI要能接工具、跑代码等，“Harness Engineering”应运而生，为AI搭建运行环境。

在Harness基础上，“loop Engineering”成为最新进化方向。Harness解决“AI能不能在真实环境里干活”，loop解决“AI能不能持续干活、自己推进任务、不需要人盯着”，核心是闭环系统运行能力。

从Prompt到loop，本质是人类对AI控制粒度不断上移，逐渐解放双手的过程。实际上，学术界早有类似理念，姚顺雨（腾讯）2022年的ReAct框架（Reason + Act）是大模型Agent方向的代表性工作，该工作在ICLR 2023获Oral级别，后续有上万引用量。ReAct将“推理”和“行动”绑定成循环过程，是最早被系统化表达的“agent loop”雏形。之后，Reflexion引入反馈机制，Tree of Thoughts扩展成多路径搜索式推理，一系列tool - use agent工作完善“规划+执行+反馈”链路，最终在工程界收敛成“loop系统”。

AI发展太快，有人兴奋，有人担忧。loop Engineering的命名者、Google工程主管Addy Osmani持保留态度，提醒要小心token成本。卡帕西引用的话“你可以外包你的思考，但你没法外包你的理解”，或许是loop热潮里最清醒的声音。