观测云更新
API Key 安全体系全面升级
为应对 AI 时代日益复杂的数据安全挑战,观测云对 API Key 体系进行了全面安全升级。
- 阅后即焚机制:工作空间级与个人级 API Key 阅后即焚,密钥仅在创建时完整展示,后续无法再次查看明文,降低密钥泄露风险。

- API Key ID 移除:前端不再展示 API Key ID,创建时亦不生成,简化用户认知的同时减少敏感信息暴露面。

- 签名认证强化:OpenAPI 与 WebSocket 接口全面支持 AK/SK 签名方式认证,替代传统明文传输,提升接口调用的安全性。
- Func 兼容性保障:新版 Func 与旧版观测云、旧版 Func 与新版观测云之间均保持兼容,确保平滑过渡。
付费计划与账单
DataKit 自监控指标 dk 不再纳入指标计费,安装时默认全部开启,方便用户随时进行故障排查与观测分析。
Agent Teams
Agent Teams 支持开启 Agent 自观测,可在 Agent 监测中查看调用趋势详情。

Agent 监测
1、总览页重构为 Agent / LLM 双视图,支持按类型查看接入与运行概况,新增请求数、Token、耗时等 KPI 概览及最近活跃实例展示;

2、查看器与分析看板支持 Agent / LLM 状态切换。Agent 状态下可按 Agent 类型及实例两级筛选;LLM 状态下可按应用筛选;


3、更新 Agent 接入配置引导,支持选择集成类型、填写实例名称并生成接入代码,提供连接验证及插件更新指引。
日志
1、日志索引高级选项中新增“全文索引字段”配置,支持两种模式:
- 仅 message 索引字段(默认):全文搜索仅在原始 message 字段中匹配,系统保留原始日志内容。
- 全行索引:全文搜索在所有业务字段中匹配,系统将丢弃原始 message 字段,提取出的业务字段将写入 variant 用于检索。


2、日志查看器查询加速配置交互优化:查询加速配置移除加速状态开关,改为删除操作;新增添加加速字段入口,支持下拉选择或手动输入,单个索引上限 200 个。

统一目录
1、全景拓扑图支持适配主题色;
2、实体详情页中,实体列表支持点击打开侧滑页查看关联实体详情,并支持返回上一级;
3、优化服务实体同步逻辑,tracing_service 不再自动写入统一目录。
故障中心
值班管理交互升级:
- 值班首页支持卡片 / 日历双视图切换。卡片视图支持按全部 / 我的筛选及搜索,当前值班自动置顶标识;日历视图支持按月查看排班,单日超过 4 条时支持展开查看完整信息;


- 值班配置优化:原“时间”更名为“工作时间”,原“生效时间”更名为“生效范围”;轮换周期新增自定义选项,支持按 1–31 天或 1–4 周设置;

- 支持创建临时代班,指定代班人和时间后,代班期间由代班人接收故障告警。


场景
视图变量新增“外部函数”查询方式,支持调用工作空间已注册的函数动态生成变量候选值。

事件中心
事件详情页跳转链路查询条件优化:从事件详情页点击“查看全部链路”时,若事件维度值为 或空值,系统不再按普通等值条件带入查询,而是自动转换为 NOT EXISTS 语法,避免查询结果为空。正常维度值的跳转逻辑保持不变。

指标
指标分析:页面新增“复制链接”按钮,支持通过链接分享跳转。

监控
1、静默规则:新增“同时静默故障”配置选项,支持在静默事件的同时同步抑制故障通知。基于监控规则、监控器标签或自定义范围配置静默时,可开启该选项,开启后规则生效期间故障将不再触发任何通知。

2、优化告警策略通知对象配置展示。
可用性监测
1、API 拨测新增 SSL 协议类型,支持对目标域名的 TLS/SSL 证书状态进行周期性检测。可配置证书剩余天数、响应时间等可用性判断条件,并支持在拨测节点发起 TLS 握手测试验证连通性;

2、任务页新增总览视图:支持按拨测类型聚合展示,通过矩形树图直观呈现各分组任务规模与健康状态;点击下钻可查看单个任务的最新检测结果,并支持一键跳转查看器分析。


APM
链路查询:新增 same_org_workspace_uuids 查询参数,支持通过 OpenAPI 和 AI API 接口,按 trace_id 跨工作空间查询同一组织下的链路数据。
其他
1、现支持 Elasticsearch Kerberos 认证,满足使用 Kerberos 安全认证机制的 ES 集群接入需求;
2、监控器配置页及仪表板图表查询页中,日志查询行新增 SLS 转 DQL 翻译能力。输入 SLS 查询语句后,系统将自动翻译为 DQL 并展示最终执行语句,预览、保存及告警执行均以翻译后的 DQL 为准。翻译结果支持切换为 DQL 编辑模式继续修改,帮助从阿里云 SLS 迁移的用户降低查询语句改写成本。
3、数据转发:
- 列表新增“显示列”配置能力,支持按需控制列表字段的展示状态。其中“转发规则”为固定显示列,其余字段可通过开关配置为显示或隐藏;
- 新增“存储路径”列。

DataKit 更新
新加功能
- 新增 IBM AS/400 (IBM i) 外部采集器,通过 ODBC 连接采集系统、磁盘、作业、内存池、子系统、作业队列和消息队列等指标
- vSphere 采集器新增虚拟机维度磁盘存储指标 disk_used_latest、disk_provisioned_latest、disk_unshared_latest
- 拨测采集器新增 SSL/TLS 证书检测任务,支持证书过期时间、剩余天数、TLS 版本等检测
- Pipeline 新增 json_all 和 pt_kvs_set_map 函数
- SNMP 采集器新增 oid_batch_size 和 bulk_max_repetitions 配置,适配 iDRAC 等对 GetBulk 请求敏感的 SNMP Agent
- PodMonitor/ServiceMonitor 改为 informer 架构,创建后修改 YAML 可动态生效,无需重启采集
问题修复
- 修复 APM 自动注入在特定场景下失败的问题
- 修复 Windows 低延迟场景下 ICMP 拨测将 0ns 回包误判为丢包的问题
- 修复 PostgreSQL 9.1+ 主从复制延迟指标因 numeric 类型转换失败导致无法上报的问题
- 修复 prom_remote_write 采集器解析失败时缺少 return 导致继续处理无效数据的问题
- 修复 compact Body 缓存 dump/load 后 PayloadType 字段不一致的 bug
- 修复 diskio 采集器单测中读写速率偶发翻倍的稳定性问题
- 修复磁盘使用率在特定条件下计算异常的问题
- 修复 HTTP API reload 后请求限流和超时配置丢失的问题,热加载后配置与首次启动保持一致
功能优化
- 容器日志采集出现重复路径时,改为保留最后一条配置并告警,不再直接丢弃采集任务
- 浏览器拨测结果中隐藏 Lightpanda 底层启动错误细节,避免暴露运行环境路径信息
- 拨测节点名称变更后自动同步到 Dialtesting 任务的上报数据中
- 补充 SNMP 自定义 YAML 模版字段格式说明文档
- 更新数据库集成 Dashboard 路径指向新的 dashboard
- CI 增加 Go module/golangci-lint 缓存复用,Docker buildx 支持 registry cache 加速镜像构建
兼容调整
- DK 自身指标采集改为全量/关闭模式,不再支持白名单过滤;Profile 采集改为手动控制
- ddtrace 采集器 telemetry tag 兼容 DD_TRACE_TAGS 字段名,正确写入 JVM 指标 tags
71

被折叠的 条评论
为什么被折叠?



