题目详情
判断题 当在一个MDP中只执行有限数量的步骤时,最优策略是平稳的.平稳的策略是指在给定状态下采取相同操作的策略,与智能体处于该状态的时间无关.( )
A. 对
B. 错
学科:[共享课]人工智能
时间:2024-10-25 04:41:08
相关题目
相关作业