题目详情
单选题 强化学习中,智能体通过什么来学习最优行为策略
A. 预先设定的规则
B. 带标签的训练数据
C. 与环境的交互和奖励信号
D. 无标签的数据集
学科:默认课程
时间:2026-01-10 09:33:24
相关题目
相关作业