部署一个 7x24 运行的基础设施智能体,持续监控服务器状态。当检测到服务宕机、磁盘空间不足、内存溢出等问题时,自动执行修复脚本或发送告警。
部署监控智能体
配置健康检查
编写修复脚本
设置告警规则
测试各种故障场景
查看 GitHub 仓库获取完整的代码和文档