computer-use-rollout

Graphs

Architecture diagram

setup python env

bash scripts/setup_env.sh

flowchart LR
    %% ========= Main-process components =========
    TL[TaskLoader]
    MSP[ModelServicePool]
    SA[StorageActor]
    AC[AgentCoordinator]

    %% ========= ModelServicePool 内部 =========
    subgraph "Model Services (spawned by ModelServicePool)"
        direction TB
        MS1["vLLM Service #1"]
        MSn["… Service #N"]
    end

    %% ========= Runtime workers =========
    subgraph "TrajectoryRunners (Ray Actors)"
        direction TB
        TR1["TrajectoryRunner #1"]
        TRn["… Runner #K"]
    end

    %% ========= Environment =========
    RDE[RemoteDesktopEnv]

    %% ========= Control & Data Flow =========
    TL  -- "tasks list"            --> AC
    MSP -- "spawns"                --> MS1
    MSP -- "spawns"                --> MSn
    AC  -- "start & manage"        --> TR1
    AC  -- "start & manage"        --> TRn
    TR1 -- "LLM generate()"        --> MSP
    TR1 -- "save trajectory"       --> SA
    TR1 -- "interact"              --> RDE
    RDE -- "screen obs / actions"  --> TR1

    %% ========= Optional styling =========
    style TL  fill:#fff5d7,stroke:#d4a017
    style MSP fill:#e7f3ff,stroke:#3b82f6
    style SA  fill:#e8fbe8,stroke:#228b22
    style AC  fill:#fff5d7,stroke:#d4a017
    style TR1 fill:#f0e8ff,stroke:#8a2be2
    style TRn fill:#f0e8ff,stroke:#8a2be2
    style RDE fill:#fdeef0,stroke:#d30000

Sequence diagram

Service-level

sequenceDiagram
    participant CLI as run.py
    participant TL  as TaskLoader
    participant C   as AgentCoordinator
    participant TR  as TrajectoryRunner(s)
    participant ST  as Storage

    %% ---------- outer service loop ----------
    loop while service_running
        CLI ->> TL: poll_for_tasks()
        TL -->> CLI: tasks_batch
        
        alt tasks_batch ≠ ∅
            CLI ->> CLI: model_service.load_latest_model()
            CLI ->> C: start_rollout(tasks_batch)

            %% --- launch runners for each task ---
            par for task in batch
                C ->>+ TR: sample_episode(task_cfg)
                TR -->> ST: (episode trajectories)
                TR -->>- C: episode_summary
            and

            end

        else (no new task)
            CLI ->> CLI: sleep(backoff_ms)
        end
    end

Episode-level

sequenceDiagram
    participant TR  as TrajectoryRunner
    participant MSP as ModelServicePool
    participant SMS as vLLM serve

    loop step < t_max until done
        TR ->> TR: prompt = PromptBuilder.build(obs, memory)
        TR ->>+ MSP: generate(prompt)
        MSP ->>+ SMS: POST /generate
        SMS -->>- MSP: tokens
        MSP -->>- TR: tokens
        TR ->> TR: action = Interpreter.parse(tokens)
        TR ->> TR: env.step(action)
    end

├── agent_coordinator.py      # 控制器：将任务加入队列（= 并行环境数量），并行启动 TrajectoryRunner，任务完成后持续补充队列
├── env_k8s.py                # 环境类：搬运自 verl 项目，修复了一些 bug
├── model_service_pool.py     # 模型类：启动 vllm serve，提供 generate 方法生成 response
├── prompts.py                # Prompt：搬运自 verl 项目
├── storage_actor.py          # 存储类：实现异步 IO，保存轨迹信息
├── task_loader.py            # 数据加载类：读取任务列表 JSON，并加载具体的 task config 信息
├── trajectory_runner.py      # 核心方法：参考 run_agent_loop，实现 agent 与 env 交互
├── ui_tars_utils.py          # 工具：将模型 response 处理成 action，搬运自 verl 项目
├── run_model.py              # 启动模型：先运行此脚本，等待模型全部加载成功（约 5 分钟）
├── run.py                    # 主流程：程序入口，参数在 config 中设置
│
├── scripts
│   ├── compare_exp_result.py       # 比较两次实验结果，保存 reward 不一致的任务
│   ├── experiment_result_stats.py  # 统计多个结果文件，计算每次成功率与总成功率
│   ├── show_result.py              # 统计单次实验结果
│   └── test_4999.ipynb             # 查看环境状态，手动释放环境等
│
└── tests
    ├── cleanup_gpu_mem.py          # 清理显存（曾出现程序停止后显存未释放的情况，已修复）
    ├── gpt_demo.py                 # vllm serve 模型单条测试
    └── test_local_model.py         # 本地加载模型单条测试

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
evaluation_examples		evaluation_examples
scripts		scripts
src		src
statistics		statistics
tests		tests
.env_example		.env_example
.gitignore		.gitignore
README.md		README.md
run.sh		run.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

computer-use-rollout

Graphs

Architecture diagram

setup python env

Sequence diagram

About

Uh oh!

Releases

Packages

Languages

Computer-use-agents/dart_rollouter

Folders and files

Latest commit

History

Repository files navigation

computer-use-rollout

Graphs

Architecture diagram

setup python env

Sequence diagram

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages