Voltar para todos os questionáriosQuestionário vinculado ao guiaDifícil Nível6 Perguntas

Questionário de streaming especulativo e previsão de vários tokens

Teste seu conhecimento sobre decodificação especulativa e previsão de vários tokens.

Pergunta 1 de 6Correto: 0

Por que a decodificação autorregressiva padrão costuma ser lenta em uma GPU?