Tillbaka till alla frågesporterGuidelänkat frågesportHårt Nivå6 Frågor

Linjär uppmärksamhet och Performer Kernels Quiz

Testa din förståelse av linjär uppmärksamhet och hur Performer approximerar softmax effektivt.

Fråga 1 av 6Rätt: 0

Varför skalar standard softmax uppmärksamhet dåligt med sekvenslängd?