Voltar para todos os questionáriosQuestionário vinculado ao guiaDifícil Nível6 Perguntas

Teste de atenção linear e kernels de desempenho

Teste sua compreensão da atenção linear e como o Performer aproxima o softmax com eficiência.

Caminhos de guia relacionados

Pergunta 1 de 6Correto: 0

Por que a atenção do softmax padrão varia mal com o comprimento da sequência?