题目详情
单选题 判断题:直接策略的RL直接优化目标函数,对策略进行参数化表示,与值函数相比,策略化参数的方法更简单,更容易收敛.( )选项
A. 错
B. 对
学科:人工智能导论
时间:2024-06-05 16:33:02
相关题目
相关作业