返回所有测验引导式测验 级别6 问题

逆强化学习测验

检查您是否掌握了现实生活中如何从行为中推断奖励以及为什么这很难。

相关引导路径

问题 1 6正确: 0

逆强化学习的目的是恢复什么?