观测云 5 月产品升级报告 | Guance Agent Teams、Agent 监测上线、AI Copilot 全面升级、场景、APM、管理多模块体验与功能深度优化

2026 年 5 月,我们收到不少用户反馈。我们把这些声音,一条条变成了产品更新,以下是本月最值得关注的 8 大升级亮点,每一个都为了让你的观测体验更顺滑、更贴合实际业务场景。

01|Obsy AI Copilot 全面升级!

需求背景

有客户反馈,平台原有 AI 能力较为分散,没有统一交互入口。日常处置告警、分析指标、复盘故障、制作视图时,常常难以快速唤起 AI 能力。同时,通过自然语言交互产出的分析内容、视图资产,无法直接沉淀至平台,需要手动二次整理,协作链路出现断层。 此外,历史对话无法留存,难以延续上下文持续分析;纯文本形式的回复也无法区分信息层级,AI 的辅助价值无法充分释放。

更新说明

本次对 Obsy AI 进行全域重构,统一交互形态、完善协作链路、丰富落地场景。

  • 全局统一 AI 入口:增设右侧抽屉式智能助手,作为 Obsy AI 唯一交互入口,统一交互形态,降低使用成本。
  • 标准化生成链路:搭建「输入意图→AI 生成草案→协同修改→确认沉淀平台资产」的标准化 AI 生成仪表板链路。
  • 历史对话管理:新增历史对话列表,内容按更新时间倒序展示,支持查看、接续对话、重命名、删除操作。会话最长留存 30 天,接续提问可完整保留原有上下文。
  • 结构化内容展示:告别单一 Markdown 文本样式,AI 回复可根据内容类型,自动适配摘要、分析结论、步骤列表、表格、风险提示等可视化组件,强化信息层级与可读性。
  • 故障中心联动:「故障中心」 - 「配置管理新」增故障自动分析开关,开通后,系统产生新故障时,将自动调用 AI 完成分析,并把结果同步至故障协作记录中。

如何体验

点击页面顶部「Obsy AI」即可打开智能助手体验。

  • 自然语言建板

当你想创建或修改一个 Dashboard 监控面板时,只要用自然语言描述分析目标,例如"分析近 7 天 API 错误率变化,并展示 TOP5 服务",Copilot 自动生成图表、标题、描述和初始布局,帮你快速得到第一版可用的分析面板。

  • 异常事件智能诊断

面对告警和故障,Copilot 可以采集日志、链路、容器、指标、主机等多维度数据,进行关联分析并生成根因分析报告。相当于在你的告警页面里直接派驻了一位 7×24 小时的值班分析师。

  • DQL 智能生成

不熟悉 DQL 语法?直接描述你想查什么,例如"查看过去一小时订单服务的错误日志"。Copilot 会自动生成对应的 DQL 查询语句,覆盖指标、日志、事件、链路全数据源,并完成语法校验。

  • 官网文档实时检索

产品功能怎么配置?参数什么意思?排障步骤是什么?Copilot 会实时检索观测云官方帮助文档,给你准确的配置说明、操作指导和可点击的文档链接,避免你在知识库里翻找。

  • 页面数据智能分析

无论你当前在看 Dashboard、RUM 前端性能页、链路追踪页还是任意数据页面,Copilot 都能基于当前视图做深度分析——总结页面核心数据、定位前端性能瓶颈、解析链路错误分布,让分析结论直接呈现在你眼前。

  • 历史对话管理

02|Obsy Agent Teams 全新上线!

需求背景

有客户反馈,面对线上高频告警、复杂故障、CI/CD 流程迭代、性能调优、云资源成本管控等场景,传统 AI 仅能输出辅助建议,无法自主执行任务。运维人员需要重复完成大量机械操作,人力投入高、问题处置存在延迟。希望依托智能体协同能力,让系统自主承接复杂工作,推进运维模式向智能化演进。

更新说明

推出面向复杂场景的 Obsy Agent Teams 智能执行团队,打造属于企业专属的 AI 团队,从问题发现、分析定位到自动化执行,连接观测云与生产环境,7×24 小时协同工作。

如何体验

在顶部「Obsy AI」抽屉主页,开通 Obsy AI 智能服务后,即可启用 Obsy Agent Team。

03|全新能力!原 LLM 监测全面升级为 Agent 监测,实现行为全链路追溯

需求背景

随着 AI 智能体在生产环境逐步落地,企业对行为管控、安全审计提出明确要求。有客户反馈原有监测能力较为基础,无法完整监控 Agent、LLM 的运行状态。实际使用中,存在越权访问、隐私数据泄露、异常工具调用等潜在风险,且缺乏完整链路追踪与多维度统计,一旦出现异常行为,难以追溯操作过程与相关主体,无法满足生产环境的治理要求。

更新说明

原 LLM 监测正式升级为 Agent 监测,从应用管理、链路查看、全局分析三大维度完善能力,全方位监测 Agent 行为风险:

  1. 应用列表优化:支持新建 Agent、LLM 两类应用,直观展示调用量、Token 消耗、平均耗时等核心指标,支持应用编辑与删除。
  2. 全链路查看器:新增 Session 列表、Trace 列表,支持下钻查看瀑布图、完整调用详情,以及模型、Skill、Tool 的调用占比分析。
  3. 多维分析看板:按请求、模型、Skill、Tool 四大模块生成统计视图,支持按单个 Agent 应用筛选查询,便于全局风险排查。

如何体验

进入平台「Agent 监测」模块,完成配置后,即可查看所有 Agent/LLM 应用的运行数据与行为记录。

04|查询体验优化!时间控件支持跨天选择,适配日志长期存储场景

需求背景

部分客户将平台日志长期转发至自建对象存储做归档留存,这类归档同步任务大多在凌晨自动执行,产生的日志天然存在跨天特征。但平台原有时间控件仅支持单日范围查询,工作人员排查历史归档日志、复盘凌晨故障时,需要多次分段查询,操作繁琐且容易遗漏关键日志。同时,调整时间区间时缺少直观预览,使用体验有待优化。

更新说明

针对数据转发 - 数据查看、日志长期查询两大高频场景,优化时间选择器交互逻辑:

  • 时间轴支持跨天拖拽调整,可自由选定多天连续时间范围,适配跨天日志检索需求;
  • 时间选择面板底部新增查询区间预览,拖动时间轴、调整滚轮时,实时展示选中的起止时间与总时长。

如何体验

进入「日志」-「查看器」,切换至「长期查询」即可查看。

05|场景可视化增强!新增仪表板列表图表,资源拓扑支持视图变量联动

需求背景

在日常观测工作中,有客户反馈需要搭建统一的导航视图,汇总各类业务、设备观测面板,但平台缺少专用导航类图表,无法实现统一规整的导航视图;另在排查架构问题时,点击资源拓扑节点后,无法自动筛选对应资源的数据,需要手动修改筛选条件,无法快速联动分析。

更新说明

结合仪表板使用场景,新增图表类型并优化拓扑交互能力:

  • 新增「仪表板列表」图表:作为导航类组件,可在当前面板内添加其他仪表板的动态链接,快速搭建统一的观测导航视图。
  • 资源拓扑联动视图变量:点击拓扑图节点,可将对应 resource、service 自动写入视图筛选条件,实现拓扑与看板图表联动,快速聚焦目标资源数据。

如何体验

  • 新建 / 编辑仪表板时,在图表列表中选择「仪表板列表」,配置链接即可完成导航面板搭建;

  • 在仪表板中添加「资源拓扑图」,点击节点即可触发视图变量自动筛选。

06|统一目录升级!支持自定义系统健康度,双视图适配不同查看场景

需求背景

有客户反馈在统一目录中搭建了完整的业务系统资产体系,希望以系统健康状态为核心,统一管控各业务运行情况、定位异常节点。不同业务线的运行标准、判定逻辑存在差异,统一的健康度计算规则无法适配个性化需求。同时原有页面展示形式单一,无法兼顾全局概览与明细下钻的使用需求,难以支撑以系统为核心的一站式排障工作。

更新说明

针对业务系统观测场景,升级统一目录系统模块,支持自定义健康度规则与多视图切换:

  • 双视图自由切换:提供列表、卡片两种展示形态。列表模式支持按健康度排序,可展开查看实体明细;卡片模式展示实体总数、最近告警时间等摘要信息,适合全局状态浏览。
  • 自定义健康度能力:支持两种配置模式,可设置系统类型级通用规则,也可针对单个业务系统独立定义计算逻辑。健康度数据基于平台 DQL 查询结果生成,由用户自主定义算法与展示样式。

如何体验

进入「统一目录」-「实体列表」-「系统」模块,在页面顶部切换「列表」/「卡片」视图,在配置项中自定义业务系统健康度计算规则。

07|APM 性能优化!大数据量排序新增风险提示,规避查询异常

需求背景

有客户反馈,大型业务场景下,应用链路数据体量庞大。工作人员排查性能问题时,常会对耗时、响应时间等字段做排序筛选。在高基数数据场景中,直接排序会触发大量后台计算,容易出现页面卡顿、查询超时的情况。前端未做相关提醒,用户在不知情的情况下反复操作,影响整体排查效率。

更新说明

在 APM 链路查看器中增设智能提醒:点击「时间」「持续时间」字段触发排序时,若系统识别该字段基数较高,将弹出提示:由于该字段基数较大,执行后可能查询等待时间较长。建议先缩小查询范围后再排序,用户可根据需求选择「取消」或「继续排序」。

如何体验

进入「应用性能监测 (APM)」-「查看器」,点击列表中的时间类字段即可触发对应提示。

08|管理后台全面优化,完善权限、溯源与实验能力,提升易用性与安全性

需求背景

多家客户反馈:

  • 平台缺少独立实验功能管理入口;
  • 企业团队成员较多时,存在大量同名账号,配置权限、分配通知、设置可见范围时极易选错人员,引发权限安全问题;
  • 操作通过 API Key 调用执行,一旦出现删库、批量变更等高风险操作,无任何调用日志和溯源记录,且明文 Key 存在泄露风险;
  • 原有日志仅支持 DQL 语法,无法兼容团队原有 SLS 使用习惯。

更新说明

本次对管理模块进行维度优化,兼顾易用性、安全性与拓展性:

  • 新增实验室模块:统一管理平台实验性功能,所有实验功能默认关闭,管理员可按需开启,配置仅在当前工作空间生效。内置「SLS 语言解析器」,开启后日志查看器支持标准 SLS 查询语法,查询入口可在 DQL、SLS 两种模式间自由切换。
  • 成员管理优化
    • 成员选择下拉框:出现同名成员时,自动补充邮箱区分;名称与邮箱均一致时,展示账号类型,已选中的成员标签同步沿用该规则;
    • 成员列表:新增「账号类型」展示列,列表上方增设「设置」按钮,支持自定义表格展示字段,配置同步生效至成员导出文件。
  • API Keys 安全升级
    • 列表新增「最后调用时间」字段,支持按时间排序,便于开展行为审计;
    • 新增安全展示策略:新创建的 API Key 仅在生成成功时展示一次明文,关闭页面后无法再次查看,降低密钥泄露风险。

如何体验

  • 实验功能:进入管理后台 -「实验室」,手动开启「SLS 语言解析器」

开启后,日志查看器即可切换查询语法;

  • 成员管理:在成员列表使用「设置」功能自定义展示列,权限配置、通知对象等场景可直观区分同名成员;

  • API Key:在「API Keys 管理」列表查看最后调用时间。

创建 Key 时遵循明文单次展示规则。

09|更多体验优化与问题修复

基础设施数据库视图优化

数据库列表页新增数据库类型图标,同时展示 QPS、负载趋势缩略图,无需进入详情页即可快速掌握数据库运行状态。

可用性监测能力升级

  • HTTP 请求设置:新增 HTTP 版本选择,支持 HTTP/1.1(默认)、HTTP/2、HTTP/3,选择 HTTP/3 时暂不支持代理配置;

  • TCP 拨测:路由跟踪每跳超时时长默认值调整为 500ms,适配复杂网络环境,减少正常节点误判超时问题。

日志与指标计费优化,存储策略更灵活

  • 日志:新增「长期存储」计费项,按长期存储周期内原始数据量统计费用(包含标准存储数据);
  • 指标:开启长期存储后,系统自动降精度压缩数据以节省存储空间,计费与常规指标融合、不单独收费;单指标集可独立配置存储策略(仅商业版按数据点数计费的工作空间支持)。

DQL语法能力增强,支持条件表达式灵活统计

DQL 正式支持CASE WHEN条件表达式,可结合聚合函数实现条件计数、条件求和、字段归一化等场景,丰富数据查询与统计能力。基本语法:

CASE
  WHEN condition THEN value
  [WHEN condition THEN value ...]
  [ELSE default_value]
END

部署版存储策略扩容,支持超长周期数据留存

自定义数据存储时长新增 60 天、90 天选项,平台整体存储上限延长至 3600 天,满足长周期数据留存、合规回溯的需求。

手机号适配,保障告警通知可用

全平台电话号码输入区域新增国家 / 地区区号选择器。原有中国大陆手机号默认绑定 +86 区号,存量用户使用不受影响。中国香港及全球站点用户可选择对应地区区号;未填写手机号的账号,需前往账号设置补充完整,保障 SMS、IVR 告警正常接收。

更多更新详见观测云五月更新日志:更新日志 - 观测云文档

每一次更新,都为了让观测更简单、更强大。每一项看似微小的体验改进,都源于我们对真实用户使用场景的深刻洞察。观测云以极微之行致广大之境 ,致力于让可观测性不仅是技术能力的堆砌,更是如丝般顺滑的操作体验。

如果您有任何功能建议或使用反馈,欢迎立即联系我们小助手/访问官网联系我们 — 您提需求,我们改产品,让观测云成为最懂你的可观测平台。

下月见,愿你的系统稳如磐石,查询疾如闪电!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值