倉庫議題

NVIDIA/TensorRT-LLM

TensorRT LLM provides users with an easy-to-use Python API to define Large Language Models (LLMs) and supports state-of-the-art optimizations to perform inference efficiently on NVIDIA GPUs. TensorRT LLM also contains components to create Python and C++ runtimes that orchestrate the inference execution in a performant way.

Star
 (13,823 star)
Fork
 (2,445 fork)
已索引議題
 (0 個已索引議題)
個開放新手議題
 (0 個開放新手議題)
最近索引
尚未索引
最近 GitHub push
2026年6月7日
授權條款
沒有授權資料
貢獻指南
沒有貢獻指南
行為準則
沒有行為準則
主要語言
Python
PR 合併指標
 (PR 指標待抓取)
新手標籤
沒有已索引的新手標籤

議題

0 個開放索引議題

此倉庫沒有開放的已索引議題。