2 comments (2 comments)1 reaction (1 reaction)0 assignees (0 assignees)C++26,755 stars (26,755 stars)4,093 forks (4,093 forks)batch import
Priority: P3enhancementhelp wantedserver time
説明
この Issue には説明がありません。
コントリビューターガイド
- 技術スタック
- cpppythontensorflow
- 領域
- machine learning
- Issue 種別
- research
- 難度新しい貢献者にとっての実装難度です。1 は非常に小さな変更、5 は専門的な作業です。
- 4
- 推定時間経験ある貢献者が調査、実装、テスト、pull request 準備にかけるおおよその時間範囲です。
- 3-5 days
- 活動状況Issue が今どれだけ取り組みやすいかを示します。新しい、活発、古い、ブロック中、またはメンテナー入力待ちなどです。
- stale
- 明確さ期待される変更、受け入れ条件、次の手順がどれだけ明確かを示します。
- unclear
- 前提条件
- Understanding of CTC lossFamiliarity with RNN TransducerBasic knowledge of DeepSpeech codebase
- 初心者向け度初回貢献者にどれだけ取り組みやすいかを 1-100 で推定したスコアです。
- 15
- 調査方針
- This issue asks to benchmark the Connectionist Temporal Classification (CTC) model against a RNN Transducer model within the DeepSpeech framework. Since the issue lacks description, one must first understand the current implementation (see DeepSpeech's model definition files, likely in Python). Then, implement a RNN Transducer model (e.g., using TensorFlow) and compare training time, word error rate, and inference speed. Existing discussions or linked PRs may provide context; check comments #753 for any hints. The benchmark should be reproducible and documented.