题海让大学四年没有难题
白天模式登陆

题目详情

单选题 在强化学习中,智能体的学习过程是一个反复与环境进行交互,不断试错、不断进步的过程.在这个过程中,智能体在环境中会选择 ,环境可能因此改变自身 ,同时环境会反馈智能体以

A. 动作、状态、奖励

B. 状态、动作、奖励

C. 动作、奖励、状态

D. 奖励、状态、动作

默认课程课程封面

学科:默认课程

时间:2026-03-28 06:33:37

Copyright © 2022 津ICP备2021001502号