题目详情
判断题 在强化学习值函数近似中,蒙特卡洛方法中可以使用SARSA和Q-learning进行真值的学习
A. 对
B. 错
学科:[共享课]人工智能
时间:2025-04-23 12:07:10
相关题目
相关作业