學習
新聞
工具
Jobs
術語表
認證
測驗
使命
支援
English
Search
⌘K
提交工具
捐款
English
Search
⌘K
學習
AI Guides & Foundations
新聞
Latest AI Developments
工具
Top AI Directory
Jobs
AI Hiring Board
術語表
AI Terms Dictionary
認證
Get Your AI Certificate
測驗
Interactive AI Assessments
使命
Why We Exist
支援
Help and Contact
提交工具
捐款
English
← 回傳所有測驗
引導式測驗 • 中等 等級 • 6 問題
Q-學習測驗
測試您對 Q-Learning 如何估計行動價值並收斂到最佳行為的理解。
相關引導路徑
問學習
問題 1 的 6
正確: 0
Q值Q(s, a)代表什麼?
需要提示嗎?
處於狀態 s 的機率
在狀態 s 中採取行動 a,然後採取最佳行動的預期長期回報
操作 a 已嘗試的次數
僅針對行動a的即時獎勵