Local multi-headed self-attention · pyg-team/pytorch_geometric#8972

Repository-Metriken

I am unable to find the clean implementation of local multi-headed self-attention in pytorch geometric. I found three types of multi-head attention, one TransformerConv (https://pytorch-geometric.readthedocs.io/en/latest/generated/torch_geometric.nn.conv.TransformerConv.html#torch_geometric.nn.conv.TransformerConv). But this one calculates a linear combination of all features with different attention weights as opposed to dividing features into multiple heads and taking their linear combination: another RGATConv in the similar direction (https://pytorch-geometric.readthedocs.io/en/latest/generated/torch_geometric.nn.conv.RGATConv.html). And finally GPSConv (https://pytorch-geometric.readthedocs.io/en/latest/generated/torch_geometric.nn.conv.GPSConv.html) that does multi-head attention but is global.

I think it is nice to have the implementation of local self-attention with multiple heads where each head looks into a part of the feature dimension.

No response

Research-Richtung: Untersuche bestehende Implementierungen in PyTorch Geometric: TransformerConv (torch geometric/nn/conv/transformer conv.py) führt eine globale lineare Kombination von Merkmalen durch, während GPSConv (torch geometric/nn/conv/gps conv.py) globale Multi Head Aufmerksamkeit durchführt. Entwerfen Sie eine lokale Version, die Merkmale in Köpfe aufteilt und Aufmerksamkeit innerhalb einer lokalen Nachbarschaft unter Verwendung eines Message Passing Schemas berechnet. Beziehen Sie sich auf RGATConv (torch geometric/nn/conv/rgat conv.py) für relationale Aufmerksamkeit, passen Sie sie jedoch an lokale Selbstaufmerksamkeit ohne Beziehungen an. Die Implementierung sollte eine neue Faltungsklasse sein, die Knotenmerkmale und edge index entgegennimmt und aktualisierte Knotenmerkmale mit lokaler Multi Head Aufmerksamkeit zurückgibt.
Tech Stack: python
Domain: machine learning
Issue Type: Funktion
Schwierigkeit: 3
Geschätzte Zeit: 3-5 Tage
Aktivitätsstatus: Veraltet
Klarheit: Klar
Voraussetzungen: PyTorch basicsAttention mechanism understandingPyTorch Geometric conventions
Einsteigerfreundlichkeit: 50