题目详情
单选题 在强化学习中,最大化回报的目标通常是通过某种策略来实现的.以下哪项最能准确描述策略在强化学习中的作用
A. 策略是确定动作选择的规则,旨在最大化未来的累计回报
B. 策略仅仅是随机选择动作的过程,无法有效影响回报
C. 策略与回报无关,优化策略不会影响学习效果
D. 策略只适用于确定性环境,无需考虑随机性
学科:
时间:2025-05-19 00:22:37
相关题目