LLM、Agent、MCP、Skill 是什么?它们之间有什么关系?

LLM、Agent、MCP、Skill 是什么?它们之间有什么关系?

前言

2024-2026 年,AI 领域最火的几个概念莫过于 LLMAgentMCPSkill。这些概念看起来各自独立,实际上它们构成了一个完整的 AI 应用体系。本文将用最通俗的方式,逐一介绍这四个概念,并解释它们之间的关系。

一、LLM(大语言模型)

1.1 是什么?

LLM(Large Language Model,大语言模型)是一种基于深度学习的 AI 模型,通过海量文本数据训练,具备理解和生成自然语言的能力。

简单来说,LLM 就是一个超级大脑——你给它一段文字,它能理解意思并生成回复。

1.2 代表产品

模型公司特点
GPT-4oOpenAI综合能力最强
ClaudeAnthropic长文本、编程能力出色
DeepSeek深度求索国产开源、性价比高
GeminiGoogle多模态能力强
通义千问阿里国内使用方便

1.3 能做什么?

  • 文本生成:写文章、写代码、写邮件
  • 对话交流:回答问题、闲聊、咨询
  • 理解分析:总结文档、分析数据、翻译
  • 推理思考:逻辑推理、数学计算、规划

1.4 局限性

LLM 本质上只是一个"语言模型",它有几个关键局限:

  • 没有记忆:每次对话都是独立的,不记得上次聊了什么(除非你把历史记录传给它)
  • 没有行动能力:只能生成文字,不能操作电脑、发邮件、查数据库
  • 知识有截止日期:训练数据有时间界限,不知道最新发生的事
  • 可能产生幻觉:有时会一本正经地编造不存在的信息

这些局限,正是 Agent 要解决的问题。

二、Agent(智能体)

2.1 是什么?

Agent(智能体/智能代理)是以 LLM 为"大脑",加上感知、记忆、工具使用、规划能力的 AI 系统。

如果说 LLM 是一个聪明但只会说话的大脑,那 Agent 就是给这个大脑装上了眼睛(感知)、手脚(工具)、记事本(记忆)和计划表(规划)。

2.2 Agent 的核心组成

┌─────────────────────────────────────┐
│              Agent                   │
│                                      │
│  ┌──────────┐    ┌──────────┐       │
│  │   LLM    │    │  Memory  │       │
│  │  (大脑)   │    │  (记忆)   │       │
│  └────┬─────┘    └──────────┘       │
│       │                              │
│  ┌────▼─────┐    ┌──────────┐       │
│  │ Planning │    │  Tools   │       │
│  │  (规划)   │    │  (工具)   │       │
│  └──────────┘    └──────────┘       │
└─────────────────────────────────────┘

四大能力:

  1. 感知(Perception):理解用户输入、读取文件、获取网页内容
  2. 记忆(Memory):短期记忆(当前对话上下文)和长期记忆(数据库存储)
  3. 规划(Planning):将复杂任务分解为多个步骤,制定执行计划
  4. 行动(Action):调用外部工具完成具体任务

2.3 Agent 的工作流程

用户:帮我查看今天的天气,然后发一封邮件给老板,告诉他明天要下雨,建议取消户外活动

Agent 的思考过程:
1. [规划] 这个任务需要两步:查天气 → 发邮件
2. [行动] 调用「天气查询工具」→ 获取明天天气:暴雨
3. [行动] 调用「邮件发送工具」→ 发送邮件给老板
4. [回复] 已查询到明天天气为暴雨,邮件已发送给老板

2.4 代表产品

产品类型说明
Cursor编程 Agent自动读代码、写代码、运行命令
Manus通用 Agent自动操作浏览器、执行复杂任务
AutoGPT开源 Agent自主规划和执行任务
Devin编程 AgentAI 软件工程师
扣子(Coze)Agent 平台可视化搭建 Agent

2.5 Agent 面临的核心问题

Agent 需要调用各种外部工具(API、数据库、文件系统等),但每个工具的接口格式都不一样。这就像一个人要同时操作几十种不同的遥控器,非常混乱。

这个问题,正是 MCP 要解决的。

三、MCP(模型上下文协议)

3.1 是什么?

MCP(Model Context Protocol,模型上下文协议)是 Anthropic 公司于 2024 年 11 月发布的一个开放标准协议,用于统一 AI 模型与外部数据源、工具之间的通信方式。

简单来说,MCP 就是 AI 世界的 USB 接口——不管什么设备,只要支持 USB 接口,就能即插即用。MCP 也一样,不管什么工具或数据源,只要实现了 MCP 协议,Agent 就能直接使用。

3.2 为什么需要 MCP?

没有 MCP 之前:

Agent ──自定义接口──→ GitHub API
Agent ──另一种接口──→ 数据库
Agent ──又一种接口──→ 文件系统
Agent ──还一种接口──→ 邮件服务

每个工具都需要写专门的对接代码,维护成本极高。

有了 MCP 之后:

Agent ──MCP协议──→ GitHub MCP Server
Agent ──MCP协议──→ 数据库 MCP Server
Agent ──MCP协议──→ 文件系统 MCP Server
Agent ──MCP协议──→ 邮件 MCP Server

所有工具都通过统一的 MCP 协议通信,Agent 只需要学会一种"语言"就能调用所有工具。

3.3 MCP 的架构

┌──────────┐     MCP协议     ┌───────────────┐
│          │ ◄──────────────► │  MCP Server   │
│          │                  │  (GitHub)     │
│          │     MCP协议     ┌───────────────┐
│  MCP     │ ◄──────────────► │  MCP Server   │
│  Client  │                  │  (数据库)      │
│  (Agent) │     MCP协议     ┌───────────────┐
│          │ ◄──────────────► │  MCP Server   │
│          │                  │  (文件系统)    │
└──────────┘                  └───────────────┘

三个核心概念:

  1. MCP Client(客户端):通常是 Agent 或 AI 应用,负责发起请求
  2. MCP Server(服务端):封装了具体工具的能力,提供统一接口
  3. MCP Protocol(协议):定义了客户端和服务端之间的通信格式

3.4 MCP 提供的三种能力

能力说明类比
Tools(工具)可执行的操作,如查询数据库、发送消息遥控器上的按钮
Resources(资源)可读取的数据,如文件、API 返回的数据电视频道
Prompts(提示词)预定义的 Prompt 模板预设的频道列表

3.5 MCP 配置示例

{
  "mcpServers": {
    "github": {
      "command": "npx",
      "args": ["@modelcontextprotocol/server-github"],
      "env": {
        "GITHUB_TOKEN": "your-token"
      }
    },
    "filesystem": {
      "command": "npx",
      "args": ["@modelcontextprotocol/server-filesystem", "/path/to/files"]
    },
    "database": {
      "command": "npx",
      "args": ["@modelcontextprotocol/server-sqlite", "path/to/db.sqlite"]
    }
  }
}

3.6 常见的 MCP Server

MCP Server功能
GitHub操作仓库、Issue、PR
FileSystem读写本地文件
SQLite/Postgres查询数据库
Brave Search搜索网页
Slack发送消息
Google Maps地图查询

四、Skill(技能)

4.1 是什么?

Skill(技能)是预定义的、可复用的指令集合,告诉 Agent 在特定场景下应该如何行动。

如果 MCP 是"工具箱",那 Skill 就是"操作手册"。工具箱里有锤子、螺丝刀、扳手,但你还需要一本手册告诉你"装柜子的时候,先用螺丝刀拧底板,再用扳手固定支架"。

4.2 Skill 的结构

一个典型的 Skill 文件(SKILL.md)包含:

# 技能名称

## 触发条件
当用户要求... 时触发

## 执行步骤
1. 第一步:做什么
2. 第二步:做什么
3. 第三步:做什么

## 注意事项
- 注意点 1
- 注意点 2

## 输出格式
- 输出要求

4.3 Skill 的实际例子

例子 1:创建 Vue 组件的 Skill

# 创建 Vue 组件

## 触发条件
当用户要求创建一个新的 Vue 组件时

## 执行步骤
1. 在 src/components/ 目录下创建组件文件
2. 使用 <script setup lang="ts"> 语法
3. 使用 SCSS scoped 样式
4. 添加必要的 Props 类型定义
5. 遵循项目的命名规范(PascalCase)

例子 2:部署项目的 Skill

# Docker 部署

## 触发条件
当用户要求部署项目时

## 执行步骤
1. 检查 Dockerfile 是否存在
2. 检查 docker-compose.yml 配置
3. 执行 docker compose build
4. 执行 docker compose up -d
5. 检查容器运行状态
6. 验证服务是否正常

4.4 Skill 与 Prompt 的区别

特性PromptSkill
用途单次对话指令可复用的操作流程
复杂度简单指令多步骤流程
持久性一次性使用永久保存,反复调用
触发方式手动输入自动匹配触发
范围针对单个任务针对一类任务

五、四者之间的关系

5.1 关系图

┌─────────────────────────────────────────────────┐
│                    Agent                         │
│                                                  │
│   ┌─────────┐   ┌─────────┐   ┌─────────┐      │
│   │   LLM   │   │  Skill  │   │  Memory │      │
│   │  (大脑)  │   │ (操作手册)│   │  (记忆)  │      │
│   └────┬────┘   └────┬────┘   └─────────┘      │
│        │              │                          │
│        └──────┬───────┘                          │
│               │                                  │
│        ┌──────▼──────┐                           │
│        │   Planning   │                          │
│        │  (规划执行)   │                          │
│        └──────┬──────┘                           │
│               │                                  │
│        ┌──────▼──────┐                           │
│        │     MCP     │                           │
│        │  (工具接口)  │                           │
│        └──────┬──────┘                           │
└───────────────┼──────────────────────────────────┘
                │
    ┌───────────┼───────────┐
    │           │           │
┌───▼───┐ ┌────▼───┐ ┌────▼───┐
│GitHub │ │数据库   │ │文件系统 │
│Server │ │Server  │ │Server  │
└───────┘ └────────┘ └────────┘

5.2 类比理解

用一个人类员工来类比:

概念类比作用
LLM大脑理解和思考能力
Agent完整的人有大脑、有手脚、能行动
MCP工具接口标准统一的工具使用方式
Skill操作手册/SOP告诉人在特定场景下怎么做

5.3 工作流程示例

场景:用户说"帮我在 GitHub 创建一个新项目,初始化 Vue 3 模板"

1. [Agent] 接收用户请求
   
2. [LLM] 理解意图 → 需要创建 GitHub 仓库 + 初始化 Vue 项目

3. [Skill] 匹配到「创建 Vue 项目」技能
   → 获取标准操作流程

4. [Agent] 根据 Skill 规划执行步骤:
   ① 在 GitHub 创建仓库
   ② 克隆到本地
   ③ 用 Vite 初始化 Vue 3 模板
   ④ 提交代码推送

5. [MCP] 通过 MCP 协议调用工具:
   ① GitHub MCP Server → 创建仓库
   ② FileSystem MCP Server → 操作本地文件
   ③ Shell MCP Server → 执行 npm 命令

6. [Agent] 汇总结果,回复用户

5.4 层次关系

底层 ←──────────────────────────────→ 高层

LLM        →    MCP       →    Skill      →    Agent
(基础能力)      (工具标准)      (操作流程)       (完整系统)

语言理解     统一工具接口    定义做事方式    整合所有能力
语言生成     连接外部世界    积累经验知识    自主完成任务

六、实际应用场景

6.1 Cursor IDE(编程场景)

Cursor = Agent
├── LLM:Claude/GPT(理解代码、生成代码)
├── MCP:FileSystem Server(读写文件)
│       Shell Server(执行命令)
│       GitHub Server(Git 操作)
├── Skill:创建组件规范、代码风格指南、部署流程
└── Memory:当前项目上下文、之前的对话

6.2 个人博客 AI 功能(本项目)

博客 AI 助手 = 简化版 Agent
├── LLM:DeepSeek API(生成总结、回答问题)
├── Tools:数据库查询(代办、日记数据)
├── Skill:总结报告模板、改进建议维度
└── Memory:AI 记录表(持久化保存)

6.3 企业级 AI 助手

企业 Agent
├── LLM:GPT-4(理解业务需求)
├── MCP:
│   ├── CRM Server(客户关系管理)
│   ├── ERP Server(企业资源规划)
│   ├── Email Server(邮件系统)
│   └── Calendar Server(日程管理)
├── Skill:
│   ├── 客户跟进 SOP
│   ├── 报告生成模板
│   └── 会议安排流程
└── Memory:企业知识库、历史交互记录

七、发展趋势

7.1 LLM 的发展

  • 模型能力持续提升:推理、编程、多模态
  • 成本持续下降:开源模型(DeepSeek、Llama)让 AI 更普惠
  • 专业化方向:医疗、法律、金融等垂直领域模型

7.2 Agent 的发展

  • 从单一 Agent 到多 Agent 协作:多个 Agent 分工合作
  • 从对话式到自主式:Agent 能自主发现和解决问题
  • 从工具调用到环境交互:Agent 能操作浏览器、桌面应用

7.3 MCP 的发展

  • 更多官方 MCP Server:覆盖更多常用服务
  • 企业级 MCP Server:对接企业内部系统
  • MCP 生态成熟:类似 npm 的 MCP Server 市场

7.4 Skill 的发展

  • Skill 市场:社区共享和交易 Skill
  • 自动 Skill 学习:Agent 从交互中自动总结 Skill
  • Skill 组合:多个 Skill 自动编排形成复杂工作流

八、总结

概念一句话解释
LLMAI 的大脑,负责理解和生成语言
AgentAI 的完整体,有大脑、手脚、记忆,能自主行动
MCPAI 的万能工具接口,统一连接各种外部服务
SkillAI 的操作手册,定义特定场景下的标准操作流程

它们的关系:LLM 是基础,Agent 是整体框架,MCP 解决工具连接问题,Skill 提供操作知识。四者共同构成了现代 AI 应用的完整技术栈。

理解了这四个概念,你就掌握了当前 AI 应用开发的核心知识体系。无论是使用 Cursor 写代码,还是搭建自己的 AI 应用,这些概念都是基础。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值