题目详情
单选题 判断题:直接策略的强化学习直接优化目标函数,对策略进行参数化表示,与值函数相比,策略化参数的方法更简单,更容易收敛.( )选项
A. 错
B. 对
学科:人工智能
时间:2023-12-18 11:42:00
相关题目
相关作业