Retour à tous les quizQuiz lié à un guideDifficile Niveau6 Questions

Quiz sur l'attention dispersée en blocs et en natif

Évaluez votre compréhension de la manière dont une attention éparse réduit le coût du transformateur sur de longues séquences.

Chemins de guidage associés

Question 1 de 6Exactement : 0

Pourquoi l’auto-attention standard est-elle coûteuse pour les longues séquences ?