Skip to content

对910b4-1的单卡虚拟化之后,无法对vnpu进行回收,无法继续切分和调度该卡。 #43

@ZhanNicky

Description

@ZhanNicky

对一张卡切分完所有显存之后,出现无法再分配资源的情况,初步排查怀疑是切分之后,vnpu中的进程没有停止,出现了阻塞。

Image

其中vnpu也出现了奇怪的状态,status一直是1,containerID 也是fffffffffff:

Image

排查对应的进程,出现了dev_sq_task这样的D进程:

Image

以及出现该单卡也无法使用。这个该如何解决?

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions