案例专题 · 非主表目录

自动化与可观测

单页专题 对应案例中心「可观测 / 平台」能力带

综合概述:本专题把发版后的探活、日志检索与关键指标对照写成可重复步骤,让 Agent 在标准、只读或受控权限下执行,减少手工遗漏。技能应绑定数据源与查询模板(如 Trace ID、服务名),并声明权限边界;对「异常阈值」类判断须标明需人工确认的告警级别。金丝雀阶段应对比错误率、延迟分位数与资源占用;多区域部署时注明按区域还是全局聚合。

案例中心 主分类的关系:正式二十类中,与本专题最接近的是第 7 类「可观测与事故」(日志聚类、巡检、值班交接)与第 8 类「平台与发布」(配置漂移、发布沟通)。本目录为补充说明页,不含独立子案例 HTML;深入条目请从上述分类进入。

落地要点(单页展开)

仪表盘与基线

列出关键面板与「正常区间」参考;发布与观测联动时固定对比基线版本与环境标签。

值班与 Runbook

与 on-call 手册交叉引用,避免重复维护两套说明;日志查询尽量参数化,避免把用户输入直接拼进查询语句。

触发与退出条件(示例)

触发:部署完成或告警标签含 canary。输出:探活结果与对比基线指标。退出:全部绿灯或已触发回滚剧本。

案例中心 · 可观测与事故 进入 devops 分类索引 应用场景(总览)