题目详情
判断题 Q-Learning是强化学习算法中基于价值函数(value-based)的一种算法,主要思想就是将State与Action构建成一张Q值表(Q-table)来存储Q值,然后根据Q值来选取能够获得最大收益的动作
A. 对
B. 错
学科:人工智能原理与方法
时间:2023-05-07 16:28:38
相关题目
相关作业