Finetune-from-model rests learning rate, is there a way to finetune without resetting it?
贡献者指南
技术栈
pythonpytorch
领域
backendmachine learning
议题类型
feature
难度面向新贡献者的预计实现难度,1 表示很小改动,5 表示专家级工作。
3
预计时间有经验贡献者完成调查、实现、测试并准备 pull request 的粗略时间范围。
1-3 hours
活动状态议题当前的可参与程度:新鲜、活跃、陈旧、阻塞或等待维护者输入。
fresh
清晰度议题是否清楚说明期望改动、验收标准和下一步。
mostly clear
前置要求
fairseq basicslearning rate scheduling
新手友好度1-100 的估计分数,表示该议题对首次贡献者的友好程度。
60
研究方向
Investigate the finetune from model command in fairseq to understand how the learning rate is reset. Consider adding a command line flag (e.g., preserve lr) to retain the original learning rate from the checkpoint. Look at the training loop in fairseq/trainer.py and relevant configurations in fairseq/optim/ to implement the option.