复盘的目标

复盘的价值不在于把事故写完整,而在于提炼能改变系统行为的信息。时间线、影响面、触发条件、检测方式和修复动作必须能被后来的维护者复用。

必须记录的字段

建议保留五类信息:用户影响、系统信号、关键时间点、根因链路、后续动作。后续动作需要明确负责人、验证方式和截止时间,否则它只是愿望清单。

模板之外的东西

复盘还应该记录“当时为什么做出这个判断”。这些判断往往隐藏了监控缺口、权限瓶颈或团队知识断层,是下一轮工程改进最真实的入口。