Java 程序员第 43 阶段 20：微服务整合大模型，完整项目实战与总结

原创于 2026-06-23 10:00:00 发布 · 241 阅读

本内容遵循CC 4.0 BY-SA版权协议

标签

#大数据

本章节将通过一个完整的实战项目，整合前面学到的所有微服务整合大模型的知识。项目将实现一个智能客服系统，涵盖微服务架构设计、大模型集成、统一网关鉴权、多租户隔离、CI/CD 自动化部署等核心功能。通过这个实战项目，读者将能够将理论知识转化为实际应用，建立起完整的微服务大模型整合技术体系。

20.2.1 业务背景

智能客服系统是一个基于大模型的智能化客户服务平台，为企业提供多渠道接入的智能客服能力。系统需要支持网站、APP、微信公众号等多个渠道的客户服务接入，通过大模型技术实现智能问答、意图识别、情感分析等功能，提升客户服务的效率和质量。

系统的核心功能包括：智能问答，基于大模型的知识库问答系统，能够理解用户问题并给出准确的答案；意图识别，自动识别用户咨询的意图，将问题分类到不同的业务模块；多轮对话，支持上下文关联的多轮对话，保持对话连贯性；工单处理，对于无法自动解决的问题，自动创建工单转人工处理；数据分析，提供客服数据的统计和分析，帮助企业优化服务质量。

┌─────────────────────────────────────────────────────────────────────────────┐
│                        智能客服系统业务架构                                   │
├─────────────────────────────────────────────────────────────────────────────┤
│                                                                              │
│                          ┌──────────────────┐                               │
│                          │    客户端接入     │                               │
│     ┌──────────────────┐ │                  │ ┌──────────────────┐         │
│     │    网站 Widget    │ │                  │ │    移动 APP       │         │
│     └──────────────────┘ │                  │ └──────────────────┘         │
│     ┌──────────────────┐ │ ┌────────────┐ │ ┌──────────────────┐         │
│     │   微信公众号     │ │ │            │ │ │   企业微信       │         │
│     └──────────────────┘ │ │            │ │ └──────────────────┘         │
│     ┌──────────────────┐ │ │   统一接入层 │ │ ┌──────────────────┐         │
│     │    小程序        │ │ │   (Gateway) │ │ │   API 接口      │         │
│     └──────────────────┘ │ │            │ │ └──────────────────┘         │
│                         │ └────────────┘ │                               │
│                         └───────┬──────────┘                               │
│                                 │                                          │
│     ┌───────────────────────────┼───────────────────────────┐              │
│     │                           ▼                                    │      │
│     │   ┌─────────────┐ ┌─────────────┐ ┌─────────────┐    │      │
│     │   │ 意图识别   │ │ 知识库检索 │ │ 对话管理   │    │      │
│     │   │ 服务       │ │ 服务       │ │ 服务       │    │      │
│     │   └─────────────┘ └─────────────┘ └─────────────┘    │      │
│     │                           │                                    │      │
│     │                           ▼                                    │      │
│     │                  ┌─────────────┐                              │      │
│     │                  │ 大模型服务 │                              │      │
│     │                  │ (LLM API) │                              │      │
│     │                  └─────────────┘                              │      │
│     │                                                              │      │
│     │   ┌─────────────┐ ┌─────────────┐ ┌─────────────┐    │      │
│     │   │ 工单服务   │ │ 知识库管理 │ │ 数据分析   │    │      │
│     │   │             │ │             │ │             │    │      │
│     │   └─────────────┘ └─────────────┘ └─────────────┘    │      │
│     └──────────────────────────────────────────────────────────┘              │
│                                                                              │
└─────────────────────────────────────────────────────────────────────────────┘

20.2.2 技术架构选型

基于微服务架构的技术选型需要考虑性能、可扩展性、可维护性等多个维度。经过综合评估，我们选择以下技术栈：微服务框架采用 Spring Cloud Alibaba，提供完善的微服务治理能力；服务网关采用 Spring Cloud Gateway，实现统一的请求路由和鉴权；服务注册与发现采用 Nacos，支持配置中心和服务发现；消息队列采用 RocketMQ，实现异步消息处理和服务解耦；缓存采用 Redis Cluster，提供高性能的缓存服务；数据库采用 MySQL 集群，结合读写分离提升数据库性能；大模型采用 OpenAI GPT-4 或国内大模型（如智谱 GLM）。

组件	技术选型	说明
------	---------	------
服务框架	Spring Cloud Alibaba 2023	完整的微服务解决方案
网关	Spring Cloud Gateway	响应式网关，高性能
注册配置	Nacos	双重角色，一体化平台
消息队列	RocketMQ	高可靠消息中间件
缓存	Redis Cluster	分布式缓存方案
数据库	MySQL 8.0	主从复制，读写分离
容器	Docker + Kubernetes	容器化部署
CI/CD	Jenkins + ArgoCD	持续集成与部署
大模型	GPT-4 / ChatGLM	智能对话能力

20.3.1 微服务拆分

根据业务边界，我们将系统拆分为以下微服务：用户服务（User Service），负责用户注册、登录、认证鉴权；客服服务（Customer Service），负责会话管理、消息处理；知识库服务（Knowledge Service），负责知识库的管理和检索；工单服务（Ticket Service），负责工单的创建、流转；AI 服务（AI Service），负责大模型调用、意图识别；数据分析服务（Analytics Service），负责数据统计和分析；通知服务（Notification Service），负责短信、邮件通知。

microservice-llm-customer/
├── docker/                          # Docker 配置文件
│   ├── docker-compose.yml           # 本地开发环境
│   └── Dockerfile                   # 微服务 Dockerfile
├── k8s/                             # Kubernetes 部署配置
│   ├── base/                        # 基础配置
│   ├── overlays/                    # 环境覆盖配置
│   │   ├── dev/
│   │   ├── test/
│   │   └── prod/
│   └── services/                   # 各服务部署清单
├── config/                          # 配置文件
│   ├── application.yml             # 主配置
│   ├── bootstrap.yml               # 引导配置
│   └── nacos/                      # Nacos 配置
├── module/                         # 公共模块
│   ├── module-common/             # 公共工具类
│   ├── module-api/                # API 公共定义
│   └── module-sdk/                # SDK 封装
├── service/                        # 业务服务
│   ├── user-service/             # 用户服务
│   ├── customer-service/         # 客服服务
│   ├── knowledge-service/        # 知识库服务
│   ├── ticket-service/          # 工单服务
│   ├── ai-service/             # AI 服务
│   ├── analytics-service/      # 数据分析服务
│   └── notification-service/   # 通知服务
├── pom.xml                        # 父 POM
└── README.md                      # 项目说明

20.3.2 核心模块实现

下面展示核心服务模块的代码实现。

// AI 服务 - 对话处理
@Service
@Slf4j
public class ConversationService {
    @Autowired
    private LlmClient llmClient;
    @Autowired
    private ConversationRepository conversationRepository;
    @Autowired
    private MessageRepository messageRepository;
    @Autowired
    private TenantContextService tenantContextService;
    @Autowired
    private QuotaService quotaService;
    /**
     * 处理用户消息
     */
    public ConversationResponse processMessage(ConversationRequest request) {
        // 1. 获取租户上下文
        String tenantId = tenantContextService.getCurrentTenantId();
        String userId = request.getUserId();
        // 2. 检查 AI 配额
        if (!quotaService.checkQuota(tenantId, 1)) {
            throw new QuotaExceededException("AI 配额已用尽");
        }
        // 3. 获取或创建会话
        Conversation conversation = getOrCreateConversation(
            tenantId, userId, request.getSessionId());
        // 4. 获取历史消息构建上下文
        List<Message> historyMessages = messageRepository
            .findByConversationIdOrderByCreateTimeAsc(conversation.getId());
        // 5. 构建提示词
        String prompt = buildPrompt(request.getContent(), historyMessages);
        // 6. 调用大模型
        String aiResponse = llmClient.chat(prompt);
        // 7. 保存消息记录
        saveMessages(conversation.getId(), request.getContent(), aiResponse);
        // 8. 扣减配额
        quotaService.consume(tenantId, 1);
        return ConversationResponse.builder()
            .sessionId(conversation.getSessionId())
            .content(aiResponse)
            .timestamp(LocalDateTime.now())
            .messageId(UUID.randomUUID().toString())
            .build();
    }
    /**
     * 构建对话提示词
     */
    private String buildPrompt(String userMessage, List<Message> history) {
        StringBuilder prompt = new StringBuilder();
        prompt.append("你是一个专业的智能客服，请根据上下文回答用户问题。\n\n");
        // 添加历史对话
        for (Message msg : history) {
            if (msg.getRole().equals("user")) {
                prompt.append("用户：").append(msg.getContent()).append("\n");
            } else {
                prompt.append("客服：").append(msg.getContent()).append("\n");
            }
        }
        prompt.append("用户：").append(userMessage).append("\n");
        prompt.append("客服：");
        return prompt.toString();
    }
    private Conversation getOrCreateConversation(String tenantId, String userId, String sessionId) {
        if (StringUtils.hasText(sessionId)) {
            return conversationRepository
                .findByTenantIdAndSessionId(tenantId, sessionId)
                .orElseGet(() -> createNewConversation(tenantId, userId));
        }
        return createNewConversation(tenantId, userId);
    }
    private Conversation createNewConversation(String tenantId, String userId) {
        Conversation conversation = Conversation.builder()
            .tenantId(tenantId)
            .userId(userId)
            .sessionId(UUID.randomUUID().toString())
            .status(ConversationStatus.ACTIVE)
            .startTime(LocalDateTime.now())
            .build();
        return conversationRepository.save(conversation);
    }
}
// AI 服务 - 大模型客户端
@Service
@Slf4j
public class LlmClient {
    @Value("${ai.provider:openai}")
    private String provider;
    @Value("${ai.model:gpt-4}")
    private String model;
    @Autowired
    private LlmConfigProperties llmConfig;
    private final RestTemplate restTemplate = new RestTemplate();
    /**
     * 调用大模型
     */
    public String chat(String prompt) {
        switch (provider.toLowerCase()) {
            case "openai":
                return chatWithOpenAI(prompt);
            case "zhipu":
                return chatWithZhipu(prompt);
            default:
                throw new IllegalArgumentException("不支持的 AI 提供商: " + provider);
        }
    }
    /**
     * OpenAI GPT 调用
     */
    private String chatWithOpenAI(String prompt) {
        try {
            HttpHeaders headers = new HttpHeaders();
            headers.setContentType(MediaType.APPLICATION_JSON);
            headers.setBearerAuth(llmConfig.getOpenai().getApiKey());
            Map<String, Object> requestBody = new HashMap<>();
            requestBody.put("model", model);
            requestBody.put("messages", List.of(
                Map.of("role", "user", "content", prompt)
            ));
            requestBody.put("temperature", 0.7);
            requestBody.put("max_tokens", 2000);
            HttpEntity<Map<String, Object>> entity = new HttpEntity<>(requestBody, headers);
            ResponseEntity<Map> response = restTemplate.postForEntity(
                llmConfig.getOpenai().getBaseUrl() + "/chat/completions",
                entity,
                Map.class
            );
            if (response.getStatusCode() == HttpStatus.OK && response.getBody() != null) {
                List<Map> choices = (List<Map>) response.getBody().get("choices");
                if (choices != null && !choices.isEmpty()) {
                    Map<String, Object> message = (Map<String, Object>) choices.get(0).get("message");
                    return (String) message.get("content");
                }
            }
            throw new LlmException("OpenAI 返回格式错误");
        } catch (Exception e) {
            log.error("OpenAI 调用失败: {}", e.getMessage());
            throw new LlmException("AI 服务调用失败: " + e.getMessage());
        }
    }
    /**
     * 智谱 GLM 调用
     */
    private String chatWithZhipu(String prompt) {
        try {
            HttpHeaders headers = new HttpHeaders();
            headers.setContentType(MediaType.APPLICATION_JSON);
            Map<String, Object> requestBody = new HashMap<>();
            requestBody.put("api_key", llmConfig.getZhipu().getApiKey());
            requestBody.put("prompt", prompt);
            HttpEntity<Map<String, Object>> entity = new HttpEntity<>(requestBody, headers);
            ResponseEntity<Map> response = restTemplate.postForEntity(
                llmConfig.getZhipu().getBaseUrl() + "/api/chatglm/completion",
                entity,
                Map.class
            );
            if (response.getStatusCode() == HttpStatus.OK && response.getBody() != null) {
                return (String) response.getBody().get("content");
            }
            throw new LlmException("智谱返回格式错误");
        } catch (Exception e) {
            log.error("智谱调用失败: {}", e.getMessage());
            throw new LlmException("AI 服务调用失败: " + e.getMessage());
        }
    }
}

20.4.1 网关路由配置

# gateway application.yml
spring:
  cloud:
    gateway:
      # 全局 CORS 配置
      globalcors:
        cors-configurations:
          '[/**]':
            allowedOrigins: "*"
            allowedMethods: "*"
            allowedHeaders: "*"
            exposedHeaders:
              - X-Tenant-Id
              - X-Request-Id
              - X-RateLimit-Remaining
      # 默认过滤器
      default-filters:
        - name: RequestSize
          args:
            maxSize: 10MB
        - name: Retry
          args:
            retries: 3
            series: SERVER_ERROR
      # 路由配置
      routes:
        # 用户服务
        - id: user-service
          uri: lb://user-service
          predicates:
            - Path=/api/user/**
          filters:
            - StripPrefix=1
            - name: TenantFilter
        # 客服服务
        - id: customer-service
          uri: lb://customer-service
          predicates:
            - Path=/api/customer/**
          filters:
            - StripPrefix=1
            - name: TenantFilter
            - name: RateLimiter
              args:
                keyResolver: "#{@userKeyResolver}"
                redis-rate-limiter.replenishRate: 100
                redis-rate-limiter.burstCapacity: 200
        # AI 服务
        - id: ai-service
          uri: lb://ai-service
          predicates:
            - Path=/api/ai/**
          filters:
            - StripPrefix=1
            - name: TenantFilter
            - name: AiQuotaFilter
            - name: ContentFilter
        # 知识库服务
        - id: knowledge-service
          uri: lb://knowledge-service
          predicates:
            - Path=/api/knowledge/**
          filters:
            - StripPrefix=1
            - name: TenantFilter
        # 工单服务
        - id: ticket-service
          uri: lb://ticket-service
          predicates:
            - Path=/api/ticket/**
          filters:
            - StripPrefix=1
            - name: TenantFilter
        # 数据分析服务
        - id: analytics-service
          uri: lb://analytics-service
          predicates:
            - Path=/api/analytics/**
          filters:
            - StripPrefix=1
            - name: TenantFilter
        # actuator 端点
        - id: actuator
          uri: lb://gateway
          predicates:
            - Path=/actuator/**

20.4.2 核心过滤器实现

// 租户过滤器
@Component
@Slf4j
public class TenantFilter implements GlobalFilter, Ordered {
    @Autowired
    private TenantIdentificationService tenantService;
    @Override
    public Mono<Void> filter(ServerWebExchange exchange, GatewayFilterChain chain) {
        ServerHttpRequest request = exchange.getRequest();
        // 识别租户
        TenantInfo tenantInfo = tenantService.identifyTenant(request);
        if (tenantInfo != null) {
            // 设置租户上下文
            TenantContext.setTenantId(tenantInfo.getTenantId());
            TenantContext.setTenantName(tenantInfo.getTenantName());
            // 添加响应头
            ServerHttpResponse response = exchange.getResponse();
            response.getHeaders().add("X-Tenant-Id", tenantInfo.getTenantId());
            log.debug("请求租户: {}", tenantInfo.getTenantId());
        }
        return chain.filter(exchange)
            .doFinally(s -> TenantContext.clear());
    }
    @Override
    public int getOrder() {
        return -150;
    }
}
// AI 配额过滤器
@Component
@Slf4j
public class AiQuotaFilter implements GlobalFilter, Ordered {
    @Autowired
    private QuotaService quotaService;
    @Override
    public Mono<Void> filter(ServerWebExchange exchange, GatewayFilterChain chain) {
        String path = exchange.getRequest().getURI().getPath();
        // 只对 AI 调用接口进行配额检查
        if (!path.startsWith("/ai/chat") && !path.startsWith("/ai/completion")) {
            return chain.filter(exchange);
        }
        String tenantId = TenantContext.getTenantId();
        if (tenantId == null) {
            return unauthorized(exchange, "租户未识别");
        }
        if (!quotaService.checkQuota(tenantId, 1)) {
            log.warn("租户 {} AI 配额已用尽", tenantId);
            return quotaExceeded(exchange, tenantId);
        }
        // 添加配额响应头
        ServerHttpResponse response = exchange.getResponse();
        response.getHeaders().add("X-AI-Quota-Remaining",
            String.valueOf(quotaService.getRemainingQuota(tenantId)));
        return chain.filter(exchange);
    }
    private Mono<Void> quotaExceeded(ServerWebExchange exchange, String tenantId) {
        ServerHttpResponse response = exchange.getResponse();
        response.setStatusCode(HttpStatus.PAYMENT_REQUIRED);
        response.getHeaders().add("X-AI-Quota-Reset",
            quotaService.getQuotaResetTime(tenantId).toString());
        Map<String, Object> body = Map.of(
            "code", 402,
            "message", "AI 配额已用尽，请升级套餐"
        );
        return writeJsonResponse(exchange, body);
    }
    @Override
    public int getOrder() {
        return -90;
    }
}

20.5.1 服务部署清单

# k8s/services/ai-service/deployment.yaml
apiVersion: apps/v1
kind: Deployment
metadata:
  name: ai-service
  namespace: production
  labels:
    app: ai-service
    version: v1
spec:
  replicas: 3
  strategy:
    type: RollingUpdate
    rollingUpdate:
      maxSurge: 1
      maxUnavailable: 0
  selector:
    matchLabels:
      app: ai-service
  template:
    metadata:
      labels:
        app: ai-service
        version: v1
    spec:
      containers:
        - name: ai-service
          image: harbor.example.com/ai-service:v1.0.0
          ports:
            - containerPort: 8080
              name: http
          env:
            - name: SPRING_PROFILES_ACTIVE
              value: "prod"
            - name: JAVA_OPTS
              value: "-Xms512m -Xmx1024m -XX:+UseG1GC"
            - name: AI_PROVIDER
              valueFrom:
                secretKeyRef:
                  name: ai-secrets
                  key: provider
            - name: AI_API_KEY
              valueFrom:
                secretKeyRef:
                  name: ai-secrets
                  key: apiKey
          resources:
            requests:
              memory: "512Mi"
              cpu: "250m"
            limits:
              memory: "1Gi"
              cpu: "1000m"
          readinessProbe:
            httpGet:
              path: /actuator/health/readiness
              port: 8080
            initialDelaySeconds: 30
            periodSeconds: 5
          livenessProbe:
            httpGet:
              path: /actuator/health/liveness
              port: 8080
            initialDelaySeconds: 60
            periodSeconds: 10
      affinity:
        podAntiAffinity:
          preferredDuringSchedulingIgnoredDuringExecution:
            - weight: 100
              podAffinityTerm:
                labelSelector:
                  matchLabels:
                    app: ai-service
                topologyKey: kubernetes.io/hostname
apiVersion: v1
kind: Service
metadata:
  name: ai-service
  namespace: production
spec:
  selector:
    app: ai-service
  ports:
    - port: 80
      targetPort: 8080
      name: http
  type: ClusterIP
apiVersion: autoscaling/v2
kind: HorizontalPodAutoscaler
metadata:
  name: ai-service-hpa
  namespace: production
spec:
  scaleTargetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: ai-service
  minReplicas: 3
  maxReplicas: 10
  metrics:
    - type: Resource
      resource:
        name: cpu
        target:
          type: Utilization
          averageUtilization: 70
    - type: Resource
      resource:
        name: memory
        target:
          type: Utilization
          averageUtilization: 80

20.5.2 Jenkins 流水线

// Jenkinsfile - ai-service
@Library('microservice-shared-library') _
pipeline {
    agent any
    environment {
        DOCKER_REGISTRY = 'harbor.example.com'
        SERVICE_NAME = 'ai-service'
        NAMESPACE = 'production'
    }
    parameters {
        string(name: 'IMAGE_TAG', defaultValue: '', description: '镜像标签')
        choice(name: 'ENVIRONMENT', choices: ['dev', 'test', 'prod'], description: '部署环境')
    }
    stages {
        stage('构建') {
            steps {
                sh '''
                    ./mvnw clean package -DskipTests=false
                '''
            }
        }
        stage('单元测试') {
            steps {
                sh './mvnw test'
                junit 'target/surefire-reports/*.xml'
            }
        }
        stage('构建镜像') {
            steps {
                script {
                    def imageTag = params.IMAGE_TAG ?: env.BUILD_NUMBER
                    def imageName = "${env.DOCKER_REGISTRY}/${env.SERVICE_NAME}:${imageTag}"
                    docker.build(imageName, "-f Dockerfile .")
                    docker.push(imageName)
                    // 推送 latest 标签
                    docker.tag(imageName, "${env.DOCKER_REGISTRY}/${env.SERVICE_NAME}:latest")
                    docker.push("${env.DOCKER_REGISTRY}/${env.SERVICE_NAME}:latest")
                    // 存储镜像信息供后续使用
                    env.FULL_IMAGE_NAME = imageName
                }
            }
        }
        stage('部署到 K8s') {
            when {
                expression { params.ENVIRONMENT == 'prod' }
            }
            steps {
                sh '''
                    kubectl set image deployment/${SERVICE_NAME} \
                        ${SERVICE_NAME}=${FULL_IMAGE_NAME} \
                        -n ${NAMESPACE}
                    kubectl rollout status deployment/${SERVICE_NAME} -n ${NAMESPACE}
                '''
            }
        }
        stage('健康检查') {
            steps {
                sh '''
                    sleep 30
                    kubectl get pods -n ${NAMESPACE} -l app=${SERVICE_NAME}
                    kubectl top pods -n ${NAMESPACE} -l app=${SERVICE_NAME}
                '''
            }
        }
    }
    post {
        success {
            echo '构建并部署成功！'
        }
        failure {
            echo '构建或部署失败！'
            // 发送告警通知
        }
    }
}

20.6.1 监控体系设计

完善的监控体系是保障系统稳定运行的关键。我们构建了三层监控体系：基础设施监控，监控服务器、网络、存储等基础设施资源；应用监控，监控微服务的性能指标、错误率、调用链路；业务监控，监控业务指标，如日活用户、会话数量、响应质量。

# Prometheus 配置
global:
  scrape_interval: 15s
  evaluation_interval: 15s
alerting:
  alertmanagers:
    - static_configs:
        - targets:
            - alertmanager:9093
rule_files:
  - /etc/prometheus/rules/*.yml
scrape_configs:
  # Kubernetes 组件
  - job_name: 'kubernetes-nodes'
    kubernetes_sd_configs:
      - role: node
    relabel_configs:
      - target_label: __address__
        replacement: kubernetes.default.svc:9100
  # Spring Boot 应用
  - job_name: 'spring-boot-apps'
    kubernetes_sd_configs:
      - role: pod
    relabel_configs:
      - source_labels: [__meta_kubernetes_pod_label_app]
        action: keep
        regex: .*-service
      - source_labels: [__meta_kubernetes_pod_container_port_number]
        action: keep
        regex: "8080"
      - action: labelmap
        regex: __meta_kubernetes_pod_label_(.+)

20.6.2 日志聚合

# Loki 配置
server:
  http_listen_port: 3100
ingester:
  lifecycler:
    address: 127.0.0.1
  chunk_idle_period: 15m
schema_config:
  configs:
    - from: 2024-01-01
      store: boltdb
      object_store: filesystem
      schema: v11
      index:
        period: 168h
        prefix: index_
storage_config:
  boltdb:
    directory: /data/index
  filesystem:
    directory: /data/chunks
limits_config:
  reject_old_samples: true
  reject_old_samples_max_age: 720h

20.7.1 技术架构总结

通过这个实战项目，我们完整实践了微服务架构与大模型整合的各个环节：在服务治理层面，我们使用 Spring Cloud Gateway 实现了统一的请求入口，通过 Nacos 实现了服务注册与配置管理，通过 Sentinel 实现了限流熔断；在安全认证层面，我们实现了基于 JWT 的统一认证，设计了完整的 RBAC 权限体系，支持多租户隔离；在数据管理层面，我们实现了三种数据隔离模式，支持租户级别的配额管理；在部署运维层面，我们使用 Kubernetes 实现了容器化部署，使用 Jenkins 实现了 CI/CD 自动化。

┌─────────────────────────────────────────────────────────────────────────────┐
│                           技术架构全景图                                      │
├─────────────────────────────────────────────────────────────────────────────┤
│                                                                              │
│ ┌─────────────────────────────────────────────────────────────────────┐    │
│ │                         接入层                                      │    │
│ │   Web │ Mobile │ MiniApp │ Official Account │ Third-party API      │    │
│ └─────────────────────────────────────────────────────────────────────┘    │
│                                    │                                        │
│                                    ▼                                        │
│ ┌─────────────────────────────────────────────────────────────────────┐    │
│ │                         网关层 (Spring Cloud Gateway)                 │    │
│ │   统一鉴权 │ 限流熔断 │ 租户识别 │ 监控埋点 │ 路由分发                │    │
│ └─────────────────────────────────────────────────────────────────────┘    │
│                                    │                                        │
│         ┌──────────────────────────┼──────────────────────────┐            │
│         │                          │                          │            │
│         ▼                          ▼                          ▼            │
│ ┌──────────────┐          ┌──────────────┐          ┌──────────────┐       │
│ │ 用户服务    │          │ AI 服务     │          │ 知识库服务   │       │
│ │ User Svc   │          │   AI Svc    │          │ Knowledge Svc│       │
│ └──────────────┘          └──────────────┘          └──────────────┘       │
│         │                          │                          │            │
│         │                          │                          │            │
│         └──────────────────────────┼──────────────────────────┘            │
│                                    │                                        │
│                                    ▼                                        │
│ ┌─────────────────────────────────────────────────────────────────────┐    │
│ │                         数据层                                        │    │
│ │   MySQL │ Redis │ RocketMQ │ Elasticsearch │ Prometheus │ Grafana     │    │
│ └─────────────────────────────────────────────────────────────────────┘    │
│                                                                              │
└─────────────────────────────────────────────────────────────────────────────┘

20.7.2 核心技术要点

通过本系列的学习，读者应该掌握以下核心技术要点：微服务架构设计，理解微服务的拆分原则、服务治理机制、服务通信模式；大模型集成，掌握与大模型 API 的对接方式、提示词工程、输出解析；统一鉴权，理解 JWT 认证流程、RBAC 权限模型、网关鉴权实现；多租户隔离，掌握租户识别、上下文传播、数据隔离、配额管理；容器化部署，理解 Docker 镜像构建、Kubernetes 部署、CI/CD 流水线；智能运维，掌握日志聚合、监控告警、链路追踪、性能优化。

20.7.3 学习路线建议

对于想要深入学习微服务整合大模型的开发者，建议按照以下路线学习：首先夯实 Java 基础，掌握 Spring Boot、Spring Cloud、数据库等核心技术；然后深入微服务治理，学习服务注册发现、负载均衡、限流熔断、配置中心等；接着学习大模型基础，了解 Transformer 架构、Prompt 工程、大模型 API 调用；再学习云原生技术，掌握 Docker 容器、Kubernetes 编排、CI/CD 流水线；最后通过项目实战，将各项技术整合应用，形成完整的技术体系。

学习路线图:
第一阶段：Java 基础
  ↓ Spring Boot 核心
  ↓ Spring Cloud 入门
第二阶段：微服务治理
  ↓ 服务注册发现
  ↓ 网关与路由
  ↓ 限流熔断
  ↓ 配置中心
第三阶段：大模型技术
  ↓ Transformer 原理
  ↓ Prompt 工程
  ↓ API 调用开发
第四阶段：云原生运维
  ↓ Docker 容器化
  ↓ Kubernetes 编排
  ↓ CI/CD 流水线
  ↓ 监控与日志
第五阶段：项目实战
  ↓ 需求分析与设计
  ↓ 代码实现与调试
  ↓ 部署上线与运维
  ↓ 性能优化与迭代