Kembali ke semua kuisKuis terkait panduanKeras Tingkat6 Pertanyaan

Kuis Perhatian Linier dan Kernel Pelaku

Uji pemahaman Anda tentang perhatian linier dan bagaimana Performer memperkirakan softmax secara efisien.

Pertanyaan 1 dari 6Benar: 0

Mengapa perhatian softmax standar berskala buruk dengan panjang urutan?