-
Notifications
You must be signed in to change notification settings - Fork 11
Open
Description
现在咱们的策略是否是尝试 3 次,之后放弃?
如果是这样的话,能否给一个 callback 配置,在放弃时可以 post 一下信息?
关于容器状态报警,这个事情的本质应该是这样的:
deployd 的责任是判断当前状态是否和预期的状态(spec)一致(例如 instance 数),如果不一致,则尽可能调整当前状态,使之于 spec 一致。
所以,对于报警,策略应该是:对于和 spec 不一致的状态,均认为是异常,进行报警。通过 retry 和 check_interval 来给 deployd 足够的时间尝试修复。在指定时间内 deployd 未能成功修复的,则应响亮的报警出来。
--by hongqn
Metadata
Metadata
Assignees
Labels
No labels