Zpět ke všem kvízůmKvíz spojený s průvodcemTěžko úroveň6 Otázky

Block-Sparse a Native Sparse Attention Quiz

Posuďte své chápání toho, jak řídká pozornost snižuje náklady na transformátor u dlouhých sekvencí.

Otázka 1 z 6správně: 0

Proč je standardní samopozornost u dlouhých sekvencí drahá?