登陆

题目详情

单选题下列关于强化学习的说法不正确的是()

A. 强化学习被广泛应用在自动驾驶、电子竞技和AI游戏中

B. 强化学习中的Agent有明确的目标用于指导自己的行为

C. Policy based的强化学习类型要明显优于Value based和Action based的方法

D. Agent的模型参数是根据环境的反馈来更新

默认课程课程封面

学科：默认课程

时间：2026-03-21 23:32:32

下载题海APP

拍照搜题更快捷

海量题库
无搜索限制
快捷拍照搜题

扫描他！然后带走我～