Torna a tutti i quizQuiz collegato alla guidaDifficile Livello6 Domande

Streaming speculativo e quiz di previsione multi-token

Metti alla prova la tua conoscenza della decodifica speculativa e della previsione multi-token.

Domanda 1 di 6Corretto: 0

Perché la decodifica autoregressiva standard è spesso lenta su una GPU?