题目详情
判断题 直接策略的RL直接优化目标函数,对策略进行参数化表示,与值函数相比,策略化参数的方法更简单,更容易收敛.( )
A. 对
B. 错
学科:人工智能导论
时间:2023-05-07 10:05:42
相关题目
相关作业