Înapoi la toate chestionareleTest legat de ghidMediu Nivel6 Întrebări

Test Q-Learning

Testați-vă înțelegerea modului în care Q-Learning estimează valorile acțiunilor și converge către un comportament optim.

Căi de ghidare aferente

Întrebare 1 de 6Corect: 0

Ce reprezintă valoarea Q Q(s, a)?