Dépôts de neuralmagic

A high-throughput and memory-efficient inference and serving engine for LLMs

Dernier commit 4 sept. 2024

(266 stars) (10 forks) (0 issues indexées) (0 good first issues ouvertes)

A high-throughput and memory-efficient inference and serving engine for LLMs

Dernier commit 4 juin 2026

(17 stars) (7 forks) (0 issues indexées) (0 good first issues ouvertes)

Recevez de nouvelles issues Easy par e-mail.