FluxML/Flux.jl

Benchmark optimizer latency on GPU

Open

#1.699 geöffnet am 24. Aug. 2021

Auf GitHub ansehen
 (0 Kommentare) (0 Reaktionen) (0 zugewiesene Personen)Julia (619 Forks)batch import
cudahelp wantedperformance

Repository-Metriken

Stars
 (4.725 Stars)
PR-Merge-Metriken
 (Durchschn. Merge 4h 27m) (2 gemergte PRs in 30 T)

Beschreibung

Ref. https://github.com/JuliaGPU/GPUCompiler.jl/issues/65#issuecomment-903155469. We should do this for both the current mutating optimizers and for Optimisers.jl. It may be that TTFG is only part of the problem.

Contributor Guide