Local multi-headed self-attention · pyg-team/pytorch_geometric#8972

(3 commenti) (1 reazione) (0 assegnatari)Python (3514 fork)batch import

featurehelp wanted

Metriche repository

I am unable to find the clean implementation of local multi-headed self-attention in pytorch geometric. I found three types of multi-head attention, one TransformerConv (https://pytorch-geometric.readthedocs.io/en/latest/generated/torch_geometric.nn.conv.TransformerConv.html#torch_geometric.nn.conv.TransformerConv). But this one calculates a linear combination of all features with different attention weights as opposed to dividing features into multiple heads and taking their linear combination: another RGATConv in the similar direction (https://pytorch-geometric.readthedocs.io/en/latest/generated/torch_geometric.nn.conv.RGATConv.html). And finally GPSConv (https://pytorch-geometric.readthedocs.io/en/latest/generated/torch_geometric.nn.conv.GPSConv.html) that does multi-head attention but is global.

I think it is nice to have the implementation of local self-attention with multiple heads where each head looks into a part of the feature dimension.

No response

Direzione di ricerca: Studia le implementazioni esistenti in PyTorch Geometric: TransformerConv (torch geometric/nn/conv/transformer conv.py) esegue una combinazione lineare globale delle feature, mentre GPSConv (torch geometric/nn/conv/gps conv.py) esegue un'attenzione multi testina globale. Progetta una versione locale che suddivide le feature in testine e calcola l'attenzione all'interno di un vicinato locale, utilizzando uno schema di message passing. Fai riferimento a RGATConv (torch geometric/nn/conv/rgat conv.py) per l'attenzione relazionale, ma adattala all'attenzione auto locale senza relazioni. L'implementazione dovrebbe essere una nuova classe di convoluzione che accetta feature dei nodi e edge index, e restituisce feature dei nodi aggiornate con attenzione multi testina locale.
Tech stack: python
Dominio: machine learning
Tipo issue: Funzionalità
Difficoltà: 3
Tempo stimato: 3-5 giorni
Stato attività: Datata
Chiarezza: Chiara
Prerequisiti: PyTorch basicsAttention mechanism understandingPyTorch Geometric conventions
Adatta ai principianti: 50