案例专题 · 非主表目录
自动化与可观测
单页专题
/
对应案例中心「可观测 / 平台」能力带
综合概述:本专题把发版后的探活、日志检索与关键指标对照写成可重复步骤,让 Agent 在标准、只读或受控权限下执行,减少手工遗漏。技能应绑定数据源与查询模板(如 Trace ID、服务名),并声明权限边界;对「异常阈值」类判断须标明需人工确认的告警级别。金丝雀阶段应对比错误率、延迟分位数与资源占用;多区域部署时注明按区域还是全局聚合。
与 案例中心 主分类的关系:正式二十类中,与本专题最接近的是第 7 类「可观测与事故」(日志聚类、巡检、值班交接)与第 8 类「平台与发布」(配置漂移、发布沟通)。本目录为补充说明页,不含独立子案例 HTML;深入条目请从上述分类进入。
落地要点(单页展开)
仪表盘与基线
列出关键面板与「正常区间」参考;发布与观测联动时固定对比基线版本与环境标签。
值班与 Runbook
与 on-call 手册交叉引用,避免重复维护两套说明;日志查询尽量参数化,避免把用户输入直接拼进查询语句。
触发与退出条件(示例)
触发:部署完成或告警标签含 canary。输出:探活结果与对比基线指标。退出:全部绿灯或已触发回滚剧本。
案例中心 · 可观测与事故
进入 devops 分类索引
应用场景(总览)