题海
让大学四年没有难题
首页
搜题
登陆
题目详情
判断题
强化学习中有有模型的方法和无模型的方法( )
A.
对
B.
错
查看答案
学科:
[共享课]人工智能
时间:
2024-10-25 04:45:34
相关题目
相关作业
题目1
多选题
使用强化学习状态的泛化表示的好处有( )
A. 减少内存的消耗
B. 复杂的计算获得更精确的表示
C. 可以采样更多的样本
D. 可以减少采样
题目2
单选题
在强化学习值函数近似中,蒙特卡洛方法对梯度计算是( )
A. <img src="https://tihai-oss-cloud.itihey.com/img/c64c76f174de69d7b1330a638b030ddc.jpg">
B. <img src="https://tihai-oss-cloud.itihey.com/img/19233f93055b2f45980b959d23a149df.jpg">
C. <img src="https://tihai-oss-cloud.itihey.com/img/c51e86d2b2e90bf3dbb005801b358c43.jpg">
D. <img src="https://tihai-oss-cloud.itihey.com/img/d4019a2887a154a93aa69a666dd1eeeb.jpg">
题目3
单选题
在强化学习值函数近似中,时间差分方法对梯度计算是( )
A. <img src="https://tihai-oss-cloud.itihey.com/img/2a68f4ad04fb5fd5de8da534e317c32e.jpg">
B. <img src="https://tihai-oss-cloud.itihey.com/img/024b795e664adf5f4d4b3199b689853f.jpg">
C. <img src="https://tihai-oss-cloud.itihey.com/img/cad0f1810075051feeca28416236d7cb.jpg">
D. <img src="https://tihai-oss-cloud.itihey.com/img/b5c5404c1fc961404ea95003dac2cd55.jpg">
题目4
判断题
在强化学习值函数近似中,蒙特卡洛方法中可以使用SARSA和Q-learning进行真值的学习( )
A. 对
B. 错
题目5
判断题
强化学习中有有模型的方法和无模型的方法( )
A. 对
B. 错
下载
题海APP
拍照搜题更快捷
海量题库
无搜索限制
快捷拍照搜题
扫描他!然后带走我~