
从Prompt到loop:AI范式四次跃迁,解放人类双手,却也引发担忧
最近网上热传,老黄黄仁勋为AI新趋势画重点:“Prompt已死,loop当立”,即“现在根本没有人写Prompt了,新时代的核心工作是编写和管理loop”。loop直译是“循环”,在AI圈指设计一个系统,让系统替人给AI下指令、验收,不合格就重来,直到完成任务。
有人疑惑,这和如今的Agent有何区别?暂且按下不表,环顾发现,除老黄外,“龙虾之父”Peter、“Claude Code之父”Boris Cherny、吴恩达等大佬都在大力推广loop。Peter表示别再给编程Agent写提示词,去设计循环;Boris称自己已不给Claude写提示词,而是让循环给Claude下指令,自己的工作就是写循环。当“写loop”成为大佬们新日常,loop显然已越过“新概念”阶段,剩下的问题是:它具体是什么,为何突然火了?
loop到底是什么
要理解loop,需回顾之前的旧范式。过去两年,AI编程的标准动作是:人写prompt,AI吐代码,不满意就再写,AI再改,人需全程盯着。卡帕西曾吐槽“人就是瓶颈”,劝告大家把自己从流程中抽离。
而loop的核心逻辑是:人定义目标,AI自己运行、验收,不合格就带着报错重来,直到通过或撞上预算上限才停止。此时,人的角色从“传话人”变成“规则设计者”。
显而易见,Agent是干活的,loop是让Agent不用人盯着也能持续干活的管理机制。没有loop的Agent,需人提一句动一下,本质上还是工具;套上loop的Agent,才成为能自转的系统。
原理虽不复杂,但有点抽象。实际上,loop已藏在熟悉的系统里,产品落地层形成了“双雄对峙”格局。
一是Claude Code,围绕loop做了三件套:/loop负责定时循环,/goal负责目标驱动,/schedule负责云端定时任务。其中,/goal最精妙,它遵循“自己不能判自己的卷子”原则,写代码的是大模型,验收的是独立小模型Haiku,确保验收有真实约束力。
二是OpenAI Codex,玩法接近“自动化流水线+目标驱动+多个子Agent”组合,最多8个Agent可在各自云端沙箱并行工作,最后汇总结果。两家实现路径不同,但形态相似,都是拆碎任务,分给多个Agent并行处理,再统一汇总。公开评测和社区口碑显示,两者表现接近,说明模型差距不大,真正的差距在上层的loop编排。
“Claude Code之父”Boris Cherny自述,去年11月卸载IDE,如今手下几百个小Agent同时工作,有的扫GitHub issue,有的读用户反馈,有的监控CI失败。每个Agent在隔离代码分支干活,一个写代码,另一个跑测试验收,搞不定的才进他的收件箱。自Opus 4.5以来,他的代码都由Claude Code写,大部分在手机上完成。Agent之间互相提示,无需人工审核。可见,loop的终极形态是:人不写代码和prompt,只写规则和判断,其余交给loop。
怎么loop起来
X上的博主Codez总结了14步实操roadmap,以下是一些干货:
- step 1:先做“4条件测试”:loop不是什么活儿都能做,动手前需回答四个问题:任务是否重复发生、有无自动化验收手段、Token预算是否扛得住、Agent有无“高级工程师”的工具。四个全通过,才值得建loop。
- step 2:从最小可行loop开始:第一次建loop,做一个四件套:触发器(如Claude Code的/loop、Codex的Automations面板)、技能(将项目上下文写进STATE.md)、状态文件(用Markdown记录进度)、门禁(能自动拦住坏结果的测试、类型检查等)。顺序很关键,要先手动跑通一次,再写成Skill,包进loop,最后上定时。跳步是loop在生产环境失败的主要原因。
- step 3:做“拆卷子”的人,别做“判卷子”的:loop设计的重要原则是写代码和验代码的分开,用不同模型或子Agent负责,且验收的不能看到写代码的推理过程。因为模型给自己的代码打分往往“手太松”,独立验收器能挑出毛病。
- step 4:避免踩坑:一是设Token上限、迭代次数上限、时间限制,防止loop无限制运行;二是将Agent学到的东西写进状态文件,避免遗忘;三是不让loop碰架构重写、鉴权代码等需要判断的活,它适合干对错清晰、机器可验证的活;四是读Diff,避免“理解力债务”。
- step 5:衡量指标:唯一有用的指标是每个被接受的改动平均成本。若“被接受率”低于50%,说明loop在亏钱。
从提示词到loop,四次范式跃迁
loop Engineering概念不到三周,但它并非凭空出现,有清晰的演化路径:从Prompt→Context→Harness→loop,共四次。
2023 - 2024年是Prompt Engineering阶段,人们关注提示词怎么写才能让AI好好干活,“会不会写prompt”基本等于“会不会用AI”,人和AI关系表面,指令需人亲自敲。
2024 - 2025年,行业强调“Context Engineering”,关注点从“怎么问”变成“给AI看什么”,AI依赖整个背景,信息组织能力比写prompt更重要,控制粒度上移到“一堆信息”。
2025 - 2026年,Agent系统进入真实开发流程,人们发现光给信息和上下文不够,AI要能接工具、跑代码等,“Harness Engineering”应运而生,为AI搭建运行环境。
在Harness基础上,“loop Engineering”成为最新进化方向。Harness解决“AI能不能在真实环境里干活”,loop解决“AI能不能持续干活、自己推进任务、不需要人盯着”,核心是闭环系统运行能力。
从Prompt到loop,本质是人类对AI控制粒度不断上移,逐渐解放双手的过程。实际上,学术界早有类似理念,姚顺雨(腾讯)2022年的ReAct框架(Reason + Act)是大模型Agent方向的代表性工作,该工作在ICLR 2023获Oral级别,后续有上万引用量。ReAct将“推理”和“行动”绑定成循环过程,是最早被系统化表达的“agent loop”雏形。之后,Reflexion引入反馈机制,Tree of Thoughts扩展成多路径搜索式推理,一系列tool - use agent工作完善“规划+执行+反馈”链路,最终在工程界收敛成“loop系统”。
AI发展太快,有人兴奋,有人担忧。loop Engineering的命名者、Google工程主管Addy Osmani持保留态度,提醒要小心token成本。卡帕西引用的话“你可以外包你的思考,但你没法外包你的理解”,或许是loop热潮里最清醒的声音。
153

被折叠的 条评论
为什么被折叠?



