0 commenti (0 commenti)0 reazioni (0 reazioni)1 assegnatario (1 assegnatario)Python276 star (276 star)101 fork (101 fork)auto 404
help wantedperformance
Descrizione
- model: Qwen/Qwen3-235B-A22B
- chip: v6e
- input: [4, 64, 256, 512, 1024, 2048, 4096]
- output: [1, 4, 1024, 4096, 8192, 16384, 24576]
- batch_size: [8,16,32,64,128,256,512]
- mode: McJAX
- hardware: tpu-v6e-32
- Tipo issue
- test
- Direzione di ricerca
- Configura l'ambiente per eseguire il modello Qwen/Qwen3-235B A22B su TPU v6e con JAX, esegui le forme di input e le dimensioni batch fornite, misura latenza e throughput e confronta con i benchmark di prestazioni attesi.