登陆

题目详情

判断题强化学习中的agent通过不断与环境交互来获取反馈,最终获得一个最优策略.( )

A. 对

B. 错

undefined课程封面

学科：

时间：2025-04-28 09:37:13

下载题海APP

拍照搜题更快捷

海量题库
无搜索限制
快捷拍照搜题

扫描他！然后带走我～