Skip to content

关于容器异常终止的重新调度 #9

@sunyi00

Description

@sunyi00

现在咱们的策略是否是尝试 3 次,之后放弃?

如果是这样的话,能否给一个 callback 配置,在放弃时可以 post 一下信息?

关于容器状态报警,这个事情的本质应该是这样的:

deployd 的责任是判断当前状态是否和预期的状态(spec)一致(例如 instance 数),如果不一致,则尽可能调整当前状态,使之于 spec 一致。

所以,对于报警,策略应该是:对于和 spec 不一致的状态,均认为是异常,进行报警。通过 retry 和 check_interval 来给 deployd 足够的时间尝试修复。在指定时间内 deployd 未能成功修复的,则应响亮的报警出来。

--by hongqn

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions