Issue del repository

xlite-dev/SageAttention

Quantized Attention that achieves speedups of 2.1-3.1x and 2.7-5.1x compared to FlashAttention2 and xformers, respectively, without lossing end-to-end metrics across various models.

Star
 (0 star)
Fork
 (0 fork)
Issue indicizzate
 (0 issue indicizzate)
issue per principianti aperte
 (0 issue per principianti aperte)
Ultima indicizzazione
Non ancora indicizzato
Ultimo push GitHub
17 gen 2026
Licenza
Nessun dato sulla licenza
Guida contributori
Nessuna guida contributori
Codice di condotta
Nessun codice di condotta
Linguaggio principale
Cuda
Metriche merge PR
 (Metriche PR in attesa)
Label per principianti
Nessuna label per principianti indicizzata

Issue

0 issue indicizzate aperte

Nessuna issue indicizzata aperta trovata per questo repository.