Agent Runtime 设计

Agent Runtime 设计

这篇只记一句

Agent Runtime 是夹在模型和外部世界之间的受控执行系统:模型只表达意图,Runtime 负责把意图变成可校验、可恢复、可审计的动作。

它不是什么

容易混的概念区别
Agent 类封装Agent 类只是代码组织;Runtime 要管状态、工具、安全、调度、观测。
Workflow 引擎Workflow 解决流程怎么跑;Runtime 还要解决模型上下文、能力注册、权限、trace。
Tool ExecutorExecutor 只负责执行工具;Runtime 还要在执行前后做编排、校验、恢复和审计。
Prompt 脚本Prompt 只影响模型怎么想;Runtime 决定系统能不能安全地做。

必背五层框架

负责什么面试关键词
入口层API、用户、租户、限流、请求规范化gateway、auth、tenant
编排状态层session、task、checkpoint、终止条件、恢复orchestrator、state machine
能力层tool、MCP、A2A、skills、模型路由capability registry
执行隔离层executor、sandbox、queue、durable workflowsandbox、worker、idempotency
治理观测层权限、审批、审计、trace、replay、evalpolicy、approval、audit

一次运行怎么走

  1. 用户请求进 Gateway,绑定身份、租户、session。
  2. Orchestrator 读取 task state,组装本轮 context。
  3. Model Router 选择模型,调用模型。
  4. 模型输出 final answer 或 tool call 等动作意图。
  5. Runtime 做 schema 校验、权限判断、审批判断、幂等检查。
  6. Executor 在隔离环境里执行工具或外部调用。
  7. 工具结果写入 state / artifact / trace。
  8. Orchestrator 判断继续、结束、等待用户、等待审批、失败恢复。

面试最爱追问

1. 为什么模型不能直接执行工具?

因为模型输出只是动作意图,不等于业务合法。Runtime 必须在模型和副作用之间插入 schema 校验、权限、审批、幂等和审计,否则一次错误 tool call 就可能变成真实事故。

2. Runtime 和 Workflow 是什么关系?

Workflow 是 Runtime 的一部分,主要处理流程编排和持久执行。Runtime 范围更大,还包括模型上下文装配、工具注册、权限治理、执行隔离、trace 和 eval。

3. Runtime 最核心的模块是什么?

Orchestrator。它读状态、组上下文、调模型、解释动作、调工具、写回状态,并决定下一步是继续、终止、等待、恢复还是转人工。

4. 为什么要有 Capability Registry?

因为能力不再只是几个本地函数,还可能来自 Function Tools、MCP servers、A2A agents、skills/plugins。统一注册后,才能统一做发现、授权、路由、版本和观测。

5. 长任务为什么需要 checkpoint?

因为长任务可能中断、失败、等待审批或后台执行。Checkpoint 记录当前阶段、已完成步骤、已产生副作用、artifact 指针和恢复位置,保证任务能继续而不是从头乱跑。

高危坑点

  • 把 Runtime 写成一个 while not done 的循环,没有显式状态机。
  • 模型一输出 tool call 就直接执行,没有权限和审批。
  • 工具结果全塞回上下文,导致 context 膨胀。
  • 只存聊天消息,不存 task state、artifact、审批和副作用记录。
  • 没有 trace,线上失败后不知道模型看了什么、调用了什么、哪里错了。
  • 没有终止条件,Agent 在工具之间循环。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值