Înapoi la toate chestionareleTest legat de ghidGreu Nivel6 Întrebări

Test paralel cu date complet fragmentate

Testați-vă înțelegerea modului în care Fully Sharded Data Parallel împarte modelele și gestionează memoria în timpul antrenamentului distribuit.

Căi de ghidare aferente

Întrebare 1 de 6Corect: 0

Ce fragmentează FSDP pe GPU-uri, ceea ce paralelismul standard de date NU face?