← Powrót do wszystkich quizówQuiz połączony z przewodnikiem • Średni Poziom • 6 Pytania
Iteracyjny DPO i quiz dotyczący dostrajania preferencji online
Sprawdź, jak rozumiesz, w jaki sposób iteracyjna optymalizacja preferencji online poprawia modele językowe.
Pytanie 1 z 6Poprawnie: 0