開放[Usage]: How to get query embeddings from ColBERT?good first issueusagevllm-project/vllm #42,234 建立於 16 天前 · Python · 80,034 stars9 則留言0 個反應1 負責人
開放[Docs] Document NIXL KV connector metrics aggregation semanticsgood first issuevllm-project/vllm #41,230 建立於 27 天前 · Python · 80,034 stars4 則留言1 個反應1 負責人
開放[Feature]: Integrate fused `kMoEFinalizeARResidualRMSNorm` from FlashInferfeature requesthelp wantedvllm-project/vllm #40,544 建立於 上個月 · Python · 80,034 stars3 則留言1 個反應0 負責人
開放[Feature]: Priority scheduling supports preemption of requests in the running queue by requests in the waiting queuefeature requesthelp wantedvllm-project/vllm #40,004 建立於 上個月 · Python · 80,034 stars5 則留言0 個反應0 負責人
開放[torch.compile] config hashing refactor follow-upsfeature requestgood first issuehelp wantedvllm-project/vllm #39,479 建立於 2 個月前 · Python · 80,034 stars15 則留言0 個反應3 負責人
開放[torch.compile] E2E correctness testing for fusionshelp wantedtorch.compilevllm-project/vllm #39,428 建立於 2 個月前 · Python · 80,034 stars6 則留言0 個反應0 負責人
開放[Bug]: Certain Ranks Take a Look Time to Load Weightsbughelp wantedvllm-project/vllm #39,030 建立於 2 個月前 · Python · 80,034 stars3 則留言0 個反應0 負責人
開放[Transformers v5] Tarsier2ForConditionalGenerationgood first issuehelp wantedvllm-project/vllm #38,736 建立於 2 個月前 · Python · 80,034 stars3 則留言0 個反應0 負責人
開放[Transformers v5] SarvamMLAForCausalLMgood first issuehelp wantedvllm-project/vllm #38,734 建立於 2 個月前 · Python · 80,034 stars2 則留言0 個反應1 負責人
開放[Transformers v5] InternVL2good first issuehelp wantedvllm-project/vllm #38,425 建立於 2 個月前 · Python · 80,034 stars4 則留言0 個反應0 負責人
開放[Transformers v5] IsaacForConditionalGenerationgood first issuehelp wantedvllm-project/vllm #38,389 建立於 2 個月前 · Python · 80,034 stars4 則留言0 個反應0 負責人
開放[Transformers v5] Base model and LoRA used in test has incorrect `tokenizer_config.json`good first issuehelp wantedvllm-project/vllm #38,386 建立於 2 個月前 · Python · 80,034 stars8 則留言0 個反應1 負責人
開放[Transformers v5] MiniCPMV cannot apply processorgood first issuehelp wantedvllm-project/vllm #38,385 建立於 2 個月前 · Python · 80,034 stars8 則留言0 個反應1 負責人
開放Upgrade to Transformers v5help wantedvllm-project/vllm #38,379 建立於 2 個月前 · Python · 80,034 stars1 則留言10 個反應1 負責人
開放[Feature]: Better Flashinfer compilation loggingfeature requesthelp wantedvllm-project/vllm #38,246 建立於 2 個月前 · Python · 80,034 stars8 則留言0 個反應0 負責人
開放[RFC]: Support ViT Full CUDA Graph (Tracker)RFChelp wantedmulti-modalityvllm-project/vllm #38,175 建立於 2 個月前 · Python · 80,034 stars14 則留言1 個反應0 負責人
開放[Feature]: Unify MoE "Oracles" with Class Structurefeature requestgood first issuehelp wantedvllm-project/vllm #37,753 建立於 2 個月前 · Python · 80,034 stars6 則留言0 個反應1 負責人
開放[Feature]: Upstream DGX spark improvements from Avarok-Cybersecurity/dgx-vllmfeature requesthelp wantednvidiaquantizationvllm-project/vllm #37,141 建立於 2 個月前 · Python · 80,034 stars13 則留言1 個反應0 負責人
開放[Performance]: qknorm+rope fusion slower than unfused on H100help wantedperformancetorch.compilevllm-project/vllm #34,391 建立於 3 個月前 · Python · 80,034 stars12 則留言1 個反應1 負責人
開放[Roadmap]: PD Disaggregation with `NixlConnector` Roadmapfeature requesthelp wantedvllm-project/vllm #33,702 建立於 4 個月前 · Python · 80,034 stars5 則留言15 個反應0 負責人
開放[Usage]: How to get query embeddings from ColBERT?good first issueusagevllm-project/vllm #42,234 建立於 16 天前 · Python · 80,034 stars9 則留言0 個反應1 負責人
開放[Docs] Document NIXL KV connector metrics aggregation semanticsgood first issuevllm-project/vllm #41,230 建立於 27 天前 · Python · 80,034 stars4 則留言1 個反應1 負責人
開放[Feature]: Integrate fused `kMoEFinalizeARResidualRMSNorm` from FlashInferfeature requesthelp wantedvllm-project/vllm #40,544 建立於 上個月 · Python · 80,034 stars3 則留言1 個反應0 負責人
開放[Feature]: Priority scheduling supports preemption of requests in the running queue by requests in the waiting queuefeature requesthelp wantedvllm-project/vllm #40,004 建立於 上個月 · Python · 80,034 stars5 則留言0 個反應0 負責人
開放[torch.compile] config hashing refactor follow-upsfeature requestgood first issuehelp wantedvllm-project/vllm #39,479 建立於 2 個月前 · Python · 80,034 stars15 則留言0 個反應3 負責人
開放[torch.compile] E2E correctness testing for fusionshelp wantedtorch.compilevllm-project/vllm #39,428 建立於 2 個月前 · Python · 80,034 stars6 則留言0 個反應0 負責人
開放[Bug]: Certain Ranks Take a Look Time to Load Weightsbughelp wantedvllm-project/vllm #39,030 建立於 2 個月前 · Python · 80,034 stars3 則留言0 個反應0 負責人
開放[Transformers v5] Tarsier2ForConditionalGenerationgood first issuehelp wantedvllm-project/vllm #38,736 建立於 2 個月前 · Python · 80,034 stars3 則留言0 個反應0 負責人
開放[Transformers v5] SarvamMLAForCausalLMgood first issuehelp wantedvllm-project/vllm #38,734 建立於 2 個月前 · Python · 80,034 stars2 則留言0 個反應1 負責人
開放[Transformers v5] InternVL2good first issuehelp wantedvllm-project/vllm #38,425 建立於 2 個月前 · Python · 80,034 stars4 則留言0 個反應0 負責人
開放[Transformers v5] IsaacForConditionalGenerationgood first issuehelp wantedvllm-project/vllm #38,389 建立於 2 個月前 · Python · 80,034 stars4 則留言0 個反應0 負責人
開放[Transformers v5] Base model and LoRA used in test has incorrect `tokenizer_config.json`good first issuehelp wantedvllm-project/vllm #38,386 建立於 2 個月前 · Python · 80,034 stars8 則留言0 個反應1 負責人
開放[Transformers v5] MiniCPMV cannot apply processorgood first issuehelp wantedvllm-project/vllm #38,385 建立於 2 個月前 · Python · 80,034 stars8 則留言0 個反應1 負責人
開放Upgrade to Transformers v5help wantedvllm-project/vllm #38,379 建立於 2 個月前 · Python · 80,034 stars1 則留言10 個反應1 負責人
開放[Feature]: Better Flashinfer compilation loggingfeature requesthelp wantedvllm-project/vllm #38,246 建立於 2 個月前 · Python · 80,034 stars8 則留言0 個反應0 負責人
開放[RFC]: Support ViT Full CUDA Graph (Tracker)RFChelp wantedmulti-modalityvllm-project/vllm #38,175 建立於 2 個月前 · Python · 80,034 stars14 則留言1 個反應0 負責人
開放[Feature]: Unify MoE "Oracles" with Class Structurefeature requestgood first issuehelp wantedvllm-project/vllm #37,753 建立於 2 個月前 · Python · 80,034 stars6 則留言0 個反應1 負責人
開放[Feature]: Upstream DGX spark improvements from Avarok-Cybersecurity/dgx-vllmfeature requesthelp wantednvidiaquantizationvllm-project/vllm #37,141 建立於 2 個月前 · Python · 80,034 stars13 則留言1 個反應0 負責人
開放[Performance]: qknorm+rope fusion slower than unfused on H100help wantedperformancetorch.compilevllm-project/vllm #34,391 建立於 3 個月前 · Python · 80,034 stars12 則留言1 個反應1 負責人
開放[Roadmap]: PD Disaggregation with `NixlConnector` Roadmapfeature requesthelp wantedvllm-project/vllm #33,702 建立於 4 個月前 · Python · 80,034 stars5 則留言15 個反應0 負責人