Finetune-from-model rests learning rate, is there a way to finetune without resetting it?
貢獻者指南
技術棧
pythonpytorch
領域
backendmachine learning
議題類型
feature
難度面向新貢獻者的預計實作難度,1 表示很小改動,5 表示專家級工作。
3
預計時間有經驗貢獻者完成調查、實作、測試並準備 pull request 的粗略時間範圍。
1-3 hours
活動狀態議題目前的可參與程度:新鮮、活躍、陳舊、阻塞或等待維護者輸入。
fresh
清晰度議題是否清楚說明預期改動、驗收標準和下一步。
mostly clear
前置要求
fairseq basicslearning rate scheduling
新手友善度1-100 的估計分數,表示該議題對首次貢獻者的友善程度。
60
研究方向
Investigate the finetune from model command in fairseq to understand how the learning rate is reset. Consider adding a command line flag (e.g., preserve lr) to retain the original learning rate from the checkpoint. Look at the training loop in fairseq/trainer.py and relevant configurations in fairseq/optim/ to implement the option.