题目详情
单选题 "策略(Policy)"在强化学习中扮演的角色是( )
A. 定义环境的初始状态
B. 决定智能体在给定状态下选择哪个动作
C. 计算环境给予的奖励值
D. 记录智能体的所有历史动作
学科:默认课程
时间:2025-12-11 12:06:51
相关题目
相关作业