监控与日志Prometheus日志
监控、日志与告警手册
说明 Prometheus 指标、Worker 状态、Kubernetes 日志采集和告警建议。
更新时间:2026-05-104 分钟阅读后台文档已发布
监控、日志与告警手册
生产环境需要同时关注业务健康、系统资源、Worker 节点状态、任务积压、积分事务、支付回调和日志脱敏。
关键指标
- API 健康检查状态。
- PostgreSQL / Redis 可用性。
- Worker heartbeat 延迟。
- ready Worker 数量。
- 高负载 Worker 数量。
- queued / running / failed 任务数量。
- 邮件发送失败率。
日志要求
应用日志输出到 stdout / stderr,建议使用结构化 JSON。日志不得输出明文密码、完整 token、AccessKey、SecretKey、仓库凭据或数据库连接串。