返回所有测验引导式测验中等 级别6 问题

多智能体强化学习测验

测试您对多个学习代理如何在共享环境中交互、协调和竞争的理解。

相关引导路径

问题 1 6正确: 0

从 MARL 中一个智能体的角度来看,是什么使得环境“不稳定”?