从提示词到协议：面向实验室自动化的AI智体

原创于 2026-06-18 00:15:00 发布 · 520 阅读

4 ·

本内容遵循CC 4.0 BY-SA版权协议

GEO检测

标签

#人工智能 #机器学习 #语言模型 #开源协议

大模型同时被 3 个专栏收录

1258 篇文章

订阅专栏

智能体

1057 篇文章

订阅专栏

机器学习

860 篇文章

订阅专栏

26年5月来自北卡大学的论文“From Prompts to Protocols: An AI Agent for Laboratory Automation”。

科学实验室的自动化能够实现更快速、更安全、更精确且更具可重复性的实验流程执行，从而加速新材料、药物及其他领域的发现与测试进程。然而，构建和运行自主实验室需要协调众多仪器与机器人，这往往迫使科学家不得不编写代码、管理配置文件并应对复杂的软件基础设施。本文提出一种将大语言模型与实验室编排系统相结合的AI智体架构，使科学家能够利用自然语言交互式地创建和监控自动化实验流程。该AI智体集成于实验编排系统（EOS）中，在包含自动验证与纠错功能的智体循环机制下运行，并支持完整的实验生命周期：包括创建实验流程、运行及监控流程与闭环优化任务，以及分析实验结果。系统配备的可视化图编辑器将实验流程呈现为交互式节点图，并与AI智体内部的流程表征保持同步，从而实现AI辅助构建与人工构建实验流程之间的无缝切换。在涵盖化学、生物学和材料科学的三个模拟自动化实验室场景中的评估结果显示，该AI智体在首次尝试生成实验流程时的成功率高达97%，并将所需的操作步骤数量降低了一个数量级。

实验室自动化能够加速新材料、药物及其他产品的发现与测试进程，使科学家能够以更快的速度、更高的安全性、更精准的精度以及更优的可重复性执行实验方案 [1], [2], [3]。实验室自动化的应用范围广泛，既包括单个仪器的自动化操作，也涵盖跨多个分布式实验室协调复杂的多步骤实验流程 [1]。构建并运行自主实验室通常需要协调众多仪器与机器人，并对其实施调度与操作以完成实验。为支持这种协调工作，自主实验室常采用实验室编排软件，为科学家提供定义及执行多步骤实验方案的标准接口。编排系统能够自动调度任务的执行时间和所用仪器，管理与各类实验室硬件的连接，收集并整理实验运行数据，以及提供优化实验参数的框架 [4], [5], [6]。然而，利用实验室编排软件创建和监控实验方案的过程依然繁琐。科学家往往需要编写 Python 代码或使用可视化积木式编程，撰写配置文件，理解调度逻辑，并监控跨多个子系统的执行过程。这些繁琐的步骤构成了实验室自动化普及的障碍，而化学家及其他物理科学家目前对此类技能的培训相对匮乏 [1]。

本文提出一种将大语言模型与实验室编排技术相结合的 AI 智体架构，使科学家能够利用自然语言交互式地创建和监控自动化实验方案。该 AI 智体依托最先进的大语言模型，支持科学家在无需编写代码或配置文件的情况下，完成实验方案创建、提交执行、运行监控、基于方案的优化实验，以及生成数据的查询与分析。例如，科学家可以向 AI 智体发出指令：“将三种输入试剂各 10 毫升加入烧瓶中，使用磁力搅拌器混合 20 秒，并利用质谱法对溶液进行表征”；随后，AI 智体会综合考量可用设备、已实现的任务功能及实验室各项约束条件，生成一套完整且经过验证的实验方案（该方案由任务及其相关参数构成的有向无环图表示）。

本文将该 AI 智体集成到实验编排系统（EOS）中，这是一个支持实验方案创建与监控的实验室编排软件 [4]。 EOS AI 智体在完整的智体循环（agentic loop）下运行：它分析科学家的请求，调用模型上下文协议（MCP）工具（例如读取任务规范文件）以收集信息并执行操作；利用 EOS 编排器的验证引擎（通过 MCP）验证其生成的实验方案及其他输出，以确保结构正确性（如检查参数值是否在允许范围内）；并自动检测和纠正错误，直至任务完成。其通过一个涵盖几乎所有 EOS 功能的 MCP 服务器公开 40 多种工具，从而实现 AI 智体与 EOS 的集成。该 AI 智体支持完整的实验生命周期，涵盖从在 EOS 中创建实验方案，到运行与监控方案及闭环优化流程，再到分析结果的各个环节。

其将 EOS AI 智体与可视化图表编辑器相结合，将实验方案呈现为交互式的节点图。这使得科学家能够直观地验证并优化由 AI 生成的实验方案。用户也可以根据需要通过图形用户界面（GUI）编辑这些图表。这些图表与 AI 智体内部的方案表示实时同步，使用户能够在 AI 辅助创建方案与手动 GUI 创建方案之间无缝切换。

EOS AI 智体在整个实验过程中为科学家提供支持，涵盖从制定实验方案到监控执行及分析结果的各个环节。将该 AI 智体集成到 EOS Web 界面中，使其在所有视图下均可用（如图 2 所示）。它能根据科学家在界面中的当前操作情境调整其行为。图中的EOS AI 智体已集成至 EOS 用户界面中。左图：协议编辑器，展示 AI 智体创建协议的过程；右图：优化任务进度追踪，包含 AI 辅助的结果分析。
请添加图片描述

实现的EOS AI 智体包含一个供用户进行交互的前端，以及一个负责处理核心逻辑并充当与外部系统桥梁的专用后端。具体而言，前端可嵌入到 Web 应用程序中；后端通过 REST API 与 EOS 编排器（Orchestrator）通信，并拥有对编排器 PostgreSQL 数据库的只读访问权限，以便进行数据查询。这种架构上的分离使得 AI 智体及其接口能够独立于 EOS 编排器进行开发和部署。目前，EOS AI 智体已集成 Claude Sonnet 4.6 和 Claude Opus 4.6，未来还将支持更多模型。

A. AI 智体架构

图 3 展示 AI 辅助实验方案创建的架构。EOS AI 智体在一个完整的智体循环（agentic loop）下运行，支持具有持久会话状态的多轮对话。当科学家发送自然语言提示（prompt）时，AI 智体会预先附加一个动态生成的系统提示，为后端模型提供全面的实验室上下文信息。该系统提示包含 EOS 领域模型、任务规范（及其参数模式和设备要求）、可用实验室的设备规格以及可用 MCP 工具的描述。系统提示还包含根据科学家当前查看的前端视图而变化的动态元素。例如，如果科学家正在查看实验系列（campaign）的进度视图，AI 智体就会接收到有关该系列的信息（如名称）。
请添加图片描述

AI 智体的方案创建过程如下：智体调用工具以获取额外上下文（例如读取现有方案或查询可用设备规格），然后编辑方案——该方案使用结构化文本格式 YAML 定义。一个独立的验证工具将方案发送给 EOS 编排器进行验证。批量错误记录器以文本格式收集所有错误，并在单次响应中将其返回。完整的错误信息反馈给智体，智体进行迭代和重新验证，直到方案有效或达到最大推理步数限制。验证通过的方案由渲染器解析，转换为可视化方案图。由于可视化方案图和方案 YAML 共享同一个底层数据存储，科学家也可以直接编辑图形，所做的更改会同步更新到方案 YAML 中。

除了方案创建外，AI 智体还可以访问涵盖 EOS 几乎所有功能的工具。还为 AI 智体配备提问工具，以便在遇到信息不完整或情况模糊时向科学家寻求反馈。AI 智体最多可提出 10 个问题，每个问题包含由智体生成的若干备选答案，同时也提供自定义答案的输入字段。AI 智体可随时使用此工具，包括提出后续追问。

B. 可视化协议渲染

可视化协议编辑器将协议渲染为基于节点的有向无环图（DAG），从而直观呈现 AI 生成及人工编写的协议。任务节点展示用于依赖关系、设备、资源和参数的、带有颜色编码及类型标识的端口；编辑器通过检查相连端口的类型兼容性来确保连接的有效性。在内部，协议被表示为任务节点列表，每个节点存储其类型、画布位置、设备与资源分配、参数值以及依赖关系列表。该结构与 EOS 使用的基于 YAML 的协议定义直接对应，因此任何 YAML 格式定义的 EOS 协议均可在可视化协议图编辑器中渲染，反之亦然。集中式状态存储充当“单一事实来源”，AI 智体和用户的直接编辑操作均写入该存储，从而确保数据一致性。当 AI 代理修改协议时，防碰撞后处理程序会调整节点位置以避免视觉重叠。

C. 模型上下文协议 (MCP) 服务器

EOS AI 智体的后端运行着一个模型上下文协议 (MCP) 服务器，该服务器允许 EOS AI 智体以及 EOS 用户界面之外的 AI 智体通过标准化的工具接口与 EOS 交互。MCP 服务器作为后端进程中的内存桥接组件运行，既避免集成代理所需的网络往返开销，又能向外部客户端提供标准的 MCP 协议接口。如图 4 所示，该服务器将 40 多种工具按功能类别进行组织，包括：任务、协议与活动（campaigns）；设备；系统管理；优化器；数据访问；以及注册表。根据安全影响，这些工具分为两类：只读工具自动执行且不中断 AI 智体的推理过程，而涉及状态变更的操作则需在执行前获得用户的明确批准。
请添加图片描述