题目详情
判断题 在强化学习值函数近似中,蒙特卡洛方法中可以使用SARSA和Q-learning进行真值的学习( )
A. 对
B. 错
学科:[共享课]人工智能
时间:2024-10-25 04:45:34
相关题目
相关作业