Shape-propagating Chain · FluxML/Flux.jl#703

(8 Kommentare) (8 Reaktionen) (0 zugewiesene Personen)Julia (619 Forks)batch import

discussionenhancementhelp wanted

Repository-Metriken

Stars: (4.725 Stars)
PR-Merge-Metriken: (Durchschn. Merge 4h 27m) (2 gemergte PRs in 30 T)

Beschreibung

It'd be nice to be able to write something like

model = @Chain(
  Input(28^2),
  Dense(32, relu),
  Dense(10),
  softmax)

It's a relatively minor convenience but it does avoid some redundancy when specifying chains, which is tedious to correct and easy to get wrong when trying different layer sizes.

Here's roughly how I imagine this working. The @Chain would expand to something like

shape = nothing
layer1, shape = fromshape(Input, shape, 10)
layer2, shape = fromshape(Dense, shape, 32, relu)
...
Chain(layer1, layer2, ...)

fromshape can then forward to an appropriate constructor or error for non-supported layers. Hopefully this strikes the right balance of simplicity/generality and we don't end up having to turn it into a full shape inference system.

Contributor Guide

Research-Richtung: Untersuche die bestehende Implementierung des @Chain Makros in Flux.jl (wahrscheinlich in src/chains.jl), um die aktuelle Syntax und Expansion zu verstehen. Definiere eine fromshape Funktion, die einen Schichttyp, die vorherige Form und Parameter entgegennimmt, um die Ausgabeform abzuleiten. Implementiere fromshape für gängige Schichten wie Dense und Input. Stelle Abwärtskompatibilität sicher. Schreibe Tests für verschiedene Kettenkonfigurationen. Konsultiere die Issue Kommentare für zusätzliche Anwendungsfälle.
Tech Stack: Keine
Domain: backend
Issue Type: Funktion
Schwierigkeit: 3
Geschätzte Zeit: 1-2 Tage
Aktivitätsstatus: Aktiv
Klarheit: Klar
Voraussetzungen: Julia
Einsteigerfreundlichkeit: 65

Repository-Metriken

Beschreibung

Contributor Guide

Erhalte frische Easy Issues per E-Mail.