help wanted
Description
我在尝试把slime的训练任务迁移到verl,但是发现权重转换有点问题,我想对这个进行调试,但是仍然需要足够规模的时间和显存来保证训练和推理的正常进行。请问有什么手段可以单独检查权重转换逻辑嘛?
slime里有--check-weight-update-equal配置来验证权重同步后的值是否正确。https://github.com/THUDM/slime/blob/main/docs/zh/developer_guide/debug.md
我在尝试把slime的训练任务迁移到verl,但是发现权重转换有点问题,我想对这个进行调试,但是仍然需要足够规模的时间和显存来保证训练和推理的正常进行。请问有什么手段可以单独检查权重转换逻辑嘛?
slime里有--check-weight-update-equal配置来验证权重同步后的值是否正确。https://github.com/THUDM/slime/blob/main/docs/zh/developer_guide/debug.md