登陆

题目详情

判断题假设马尔可夫决策问题(MDP)的状态是有限的,通过值迭代找到的策略优于通过策略迭代找到的策略.( )

A. 对

B. 错

[共享课]人工智能课程封面

学科：[共享课]人工智能

时间：2024-10-25 04:41:08

下载题海APP

拍照搜题更快捷

海量题库
无搜索限制
快捷拍照搜题

扫描他！然后带走我～