登陆

题目详情

多选题 DQN对传统Q-learning做了三处改进:( )

A. 利用深度卷积神经网络逼近值函数

B. 利用了经验回放对强化学习的学习过程进行训练

C. 独立设置了目标网络来单独处理时间差分算法中的TD偏差

D. 解决了Q-Learning 对价值的过高估计的问题

人工智能原理与方法课程封面

学科：人工智能原理与方法

时间：2023-05-09 09:37:15

下载题海APP

拍照搜题更快捷

海量题库
无搜索限制
快捷拍照搜题

扫描他！然后带走我～