FluxML/Flux.jl

Benchmark optimizer latency on GPU

Open

#1,699 建立於 2021年8月24日

在 GitHub 查看
 (0 留言) (0 反應) (0 負責人)Julia (4,725 star) (619 fork)batch import
cudahelp wantedperformance

描述

Ref. https://github.com/JuliaGPU/GPUCompiler.jl/issues/65#issuecomment-903155469. We should do this for both the current mutating optimizers and for Optimisers.jl. It may be that TTFG is only part of the problem.

貢獻者指南