Voltar para todos os questionáriosQuestionário vinculado ao guiaDifícil Nível6 Perguntas

Questionário paralelo de dados totalmente fragmentados

Teste sua compreensão de como o Fully Sharded Data Parallel divide modelos e gerencia a memória durante o treinamento distribuído.

Caminhos de guia relacionados

Pergunta 1 de 6Correto: 0

O que o FSDP fragmenta nas GPUs que o paralelismo de dados padrão NÃO faz?