一、背景与痛点
1.1 问题场景
使用 Vertex AI Gemini 模型(如 gemini-3-pro-image / gemini-3.1-flash-image)进行图片生成或多模态推理时,随着流量增长会频繁遇到 429 Resource Exhausted 错误。
典型报错:
google.api_core.exceptions.ResourceExhausted: 429 Resource has been exhausted
(e.g. check quota).
1.2 根因分析
| 根因 | 说明 | 影响 |
|---|---|---|
| 按需配额不足 | 每个项目/区域有默认 QPM/TPM 上限 | 流量超额即 429 |
| preview 端点 QPM 低 | preview 模型默认 QPM 仅 20 | 极易触发限流 |
| global 端点共享池 | 多区域共享资源池竞争 | 高峰期不稳定 |
| 无重 |
订阅专栏 解锁全文

320

被折叠的 条评论
为什么被折叠?



