Вернуться ко всем викторинамВикторина, связанная с руководствомЖесткий Уровень6 Вопросы

Викторина по обучающим стекам DeepSpeed и Megatron

Проверьте свое понимание методов параллелизма и оптимизации памяти, лежащих в основе крупномасштабного обучения моделей.

Связанные направляющие пути

Вопрос 1 из 6Правильно: 0

Какова основная цель оптимизатора ZeRO компании DeepSpeed?