题目详情
单选题 在强化学习中,智能体的学习过程是一个反复与环境进行交互,不断试错、不断进步的过程.在这个过程中,智能体在环境中会选择 ,环境可能因此改变自身 ,同时环境会反馈智能体以
A. 动作、状态、奖励
B. 状态、动作、奖励
C. 动作、奖励、状态
D. 奖励、状态、动作
学科:默认课程
时间:2026-03-28 06:33:37
相关题目
相关作业