verl-project/verl

希望可以增加单独检查权重转换逻辑

Open

#6414 opened on May 20, 2026

View on GitHub
 (1 comment) (0 reactions) (0 assignees)Python (21,533 stars) (3,940 forks)auto 404
help wanted

Description

我在尝试把slime的训练任务迁移到verl,但是发现权重转换有点问题,我想对这个进行调试,但是仍然需要足够规模的时间和显存来保证训练和推理的正常进行。请问有什么手段可以单独检查权重转换逻辑嘛?

slime里有--check-weight-update-equal配置来验证权重同步后的值是否正确。https://github.com/THUDM/slime/blob/main/docs/zh/developer_guide/debug.md

Contributor guide