[Feature request] Support loading GGUF and GGML model format · lm-sys/FastChat#2410

(5 commentaires) (7 réactions) (0 assignés)Python (4 736 forks)batch import

good first issue

Métriques du dépôt

Cette issue ne contient pas de description.

Direction de recherche: Explorez comment les formats de modèle GGUF/GGML sont chargés dans d'autres frameworks de service LLM (par exemple, llama.cpp, Ollama). Identifiez les modifications nécessaires dans le chargeur de modèles de FastChat pour prendre en charge ces formats. Concentrez vous sur `fastchat.model.model adapter` et les modules associés.
Stack technique: python
Domaine: machine learningbackend
Type d'issue: Fonctionnalité
Difficulté: 3
Temps estimé: Une demi journée
Statut d'activité: Active
Clarté: Plutôt claire
Prérequis: PythonFamiliarity with LLM model formats
Accessibilité débutant: 50