← 返回首页

SRE AI Agent 系列

从 0 搭一个实验排障 AI Agent · 全程记录

📅 2026-07-02 开更 📁 系列博客 AI Agent AIOps LLM SRE

SERIES · 进行中

这个系列记录我基于一个开源 AIOps 项目，搭一个SRE 实验排障 AI Agent的全过程。

从架构选型、prompt 设计、工具调用、到 lesson learned——不会写成"完美教程"，会更偏"一个 SRE 小白第一次玩 AI Agent 时踩的坑"。

这个系列会写什么

为什么想做这个、解决了 SRE 日常哪个痛点
选型对比：开源 AIOps 项目有哪些、各自适合什么场景
架构设计：Agent + Tool + Memory 怎么组合
Prompt 工程：从"会回答"到"会排障"的迭代
接入真实告警数据：从 demo 到生产化
踩坑集：幻觉、上下文超限、敏感操作安全

系列目录

关联链接

⭐ GitHub @andersthorvald 👤 关于我 📚 全部文档

更新节奏

每周 1–2 篇，跟实验进展同步。最终目标：能让我自己（一个真 SRE）下班时间少被叫醒。

系列完结后会把所有代码 + 配置 + prompt 模板打包开源，单独的仓库。