SERIES · 进行中
这个系列记录我基于一个开源 AIOps 项目,搭一个SRE 实验排障 AI Agent的全过程。
从架构选型、prompt 设计、工具调用、到 lesson learned——不会写成"完美教程",会更偏"一个 SRE 小白第一次玩 AI Agent 时踩的坑"。
这个系列会写什么
- 为什么想做这个、解决了 SRE 日常哪个痛点
- 选型对比:开源 AIOps 项目有哪些、各自适合什么场景
- 架构设计:Agent + Tool + Memory 怎么组合
- Prompt 工程:从"会回答"到"会排障"的迭代
- 接入真实告警数据:从 demo 到生产化
- 踩坑集:幻觉、上下文超限、敏感操作安全
系列目录
关联链接
更新节奏
每周 1–2 篇,跟实验进展同步。最终目标:能让我自己(一个真 SRE)下班时间少被叫醒。
系列完结后会把所有代码 + 配置 + prompt 模板打包开源,单独的仓库。