题海让大学四年没有难题
白天模式登陆

题目详情

单选题 强化学习中,智能体通过什么来学习最优行为策略

A. 预先设定的规则

B. 带标签的训练数据

C. 与环境的交互和奖励信号

D. 无标签的数据集

默认课程课程封面

学科:默认课程

时间:2026-01-10 09:33:24

Copyright © 2022 津ICP备2021001502号