verl-project/verl

希望可以增加单独检查权重转换逻辑

Open

#6,414 建立於 2026年5月20日

在 GitHub 查看
 (1 留言) (0 反應) (0 負責人)Python (21,533 star) (3,940 fork)auto 404
help wanted

描述

我在尝试把slime的训练任务迁移到verl,但是发现权重转换有点问题,我想对这个进行调试,但是仍然需要足够规模的时间和显存来保证训练和推理的正常进行。请问有什么手段可以单独检查权重转换逻辑嘛?

slime里有--check-weight-update-equal配置来验证权重同步后的值是否正确。https://github.com/THUDM/slime/blob/main/docs/zh/developer_guide/debug.md

貢獻者指南