Zpět ke všem kvízůmKvíz spojený s průvodcemTěžko úroveň6 Otázky

Spekulativní streamování a multi-tokenový predikční kvíz

Otestujte si své znalosti spekulativního dekódování a predikce více tokenů.

Otázka 1 z 6správně: 0

Proč je standardní autoregresivní dekódování na GPU často pomalé?