Dépôts

Dépôts de neuralmagic

A high-throughput and memory-efficient inference and serving engine for LLMs

Dernier commit 4 sept. 2024

 (266 stars) (10 forks) (0 issues indexées) (0 good first issues ouvertes)

A high-throughput and memory-efficient inference and serving engine for LLMs

Dernier commit 4 juin 2026

 (17 stars) (7 forks) (0 issues indexées) (0 good first issues ouvertes)