构建一个生成式 AI 聊天应用,该应用使用检索增强生成 (RAG) 技术,根据组织的数据提供有依据的准确回答。本指南介绍了 生成式 AI RAG with Cloud SQL 应用模板,您可以根据自己的独特需求自定义该模板,并将其部署为应用。
例如,您可以实现此模板来满足以下业务需求:
| 示例 | 业务需求 | 实现 |
|---|---|---|
| 客户服务聊天机器人 | 公司需要提供即时客户支持。 | 在 Cloud Run 上托管聊天界面。Vertex AI 会处理嵌入,并根据以向量形式存储在 Cloud SQL 中的技术文档生成回答。 |
| 内部人力资源助理 | 员工需要查找有关福利、公司政策和内部程序的信息。 | 在 Cloud Run 上托管 HR 助理。当员工查询该工具时,Vertex AI 会从 Cloud SQL 中检索相关政策信息,以生成准确且有来源依据的回答。 |
| 法律文件研究人员 | 法律团队需要快速在大型文档库中找到相关的判例法或合同条款。 | 在 Cloud Run 上托管研究门户。Vertex AI 使用存储在 Cloud SQL 中的法律文件(以向量形式)总结相关先例并识别合同中的特定措辞。 |
| 语义商品搜索 | 电子商务公司希望使用自然语言描述(而非确切的关键字)来帮助用户搜索产品。 | 在 Cloud Run 上托管搜索界面。Vertex AI 会处理用户说明,以从存储在 Cloud SQL 中的商品目录(以向量形式存储)中返回语义相关度最高的产品。 |
架构
下图显示了应用中的组件和连接:
以下是应用的请求处理流程:
- 将数据加载到 Cloud SQL 中的 PostgreSQL 数据库。
- Vertex AI 会创建文本字段的嵌入,并以向量形式将其存储在数据库中。
- Cloud Load Balancing 前端接收外部请求并将流量分配到 Cloud Load Balancing 后端。
- Cloud Load Balancing 后端将流量分配给 Cloud Run 前端服务。
- 前端服务与检索服务通信,以进行生成式 AI 调用。
- 检索服务使用 Secret Manager 安全地访问 Vertex AI 和 Cloud SQL 所需的 API 密钥和凭证。
- 检索服务将请求转换为嵌入,并在 Cloud SQL 数据库中搜索相似的向量。
- 检索服务会将搜索结果与初始提示一并发送至 Vertex AI,以创建回答。
后续步骤
- 通过基于 Google 模板进行构建,复制并自定义此模板。
- 通过设计应用模板来定义您自己的配置。
- 通过Google Cloud 架构框架确定一般架构最佳实践。