[Feature request] Support loading GGUF and GGML model format · lm-sys/FastChat#2410

(5 comments) (7 reactions) (0 assignees)Python (4.736 forks)batch import

good first issue

Métricas do repositório

Este issue não inclui uma descrição.

Direção de pesquisa: Explore como os formatos de modelo GGUF/GGML são carregados em outros frameworks de serviço LLM (ex.: llama.cpp, Ollama). Identifique as alterações necessárias no carregador de modelos do FastChat para suportar esses formatos. Foco em `fastchat.model.model adapter` e módulos relacionados.
Pilha de tecnologia: python
Domain: machine learningbackend
Tipo Issue: Funcionalidade
Difficulty: 3
Tempo estimado: Meio dia
Status da atividade: Ativo
Clarity: Principalmente claro
Prerequisites: PythonFamiliarity with LLM model formats
Simpatia para novatos: 50