题海
让大学四年没有难题
首页
搜题
登陆
题目详情
判断题
深度强化学习结合了深度学习强大的特征提取能力和强化学习的决策能力
A.
正确
B.
错误
查看答案
学科:
默认课程
时间:
2025-12-05 02:06:47
相关题目
相关作业
题目1
单选题
强化学习中,智能体与环境交互时,环境根据智能体采取的动作返回( )
A. 新状态和奖励
B. 仅新状态
C. 仅奖励
D. 随机信息
题目2
单选题
Q - learning 算法属于( )
A. 基于策略的强化学习算法
B. 基于价值的强化学习算法
C. 无模型的强化学习算法
D. 模型基的强化学习算法
题目3
单选题
以下用于解决强化学习中探索与利用平衡问题的方法是( )
A. 经验回放
B. 目标网络
C. ε - greedy 策略
D. 策略梯度
题目4
单选题
深度 Q 网络(DQN)中,引入经验回放机制的主要目的是( )
A. 减少计算量
B. 提高样本利用率,打破样本间的相关性
C. 加速模型收敛
D. 降低模型复杂度
题目5
单选题
在强化学习中,折扣因子 γ(0 ≤ γ ≤ 1)的作用是( )
A. 调整学习率
B. 控制探索与利用的平衡
C. 衡量未来奖励的重要程度
D. 决定策略更新的频率
题目6
填空题
马尔可夫决策过程(MDP)由状态集合 S、动作集合 A、状态转移概率 P、奖励函数 R 和____γ组成
题目7
判断题
强化学习中,智能体不需要知道环境的具体模型也能学习到最优策略
A. 正确
B. 错误
题目8
判断题
策略梯度算法只能应用于离散动作空间的强化学习问题
A. 正确
B. 错误
题目9
判断题
在强化学习中,奖励函数的设计对学习效果影响不大
A. 正确
B. 错误
题目10
判断题
深度强化学习结合了深度学习强大的特征提取能力和强化学习的决策能力
A. 正确
B. 错误
下载
题海APP
拍照搜题更快捷
海量题库
无搜索限制
快捷拍照搜题
扫描他!然后带走我~