题目详情
单选题 强化学习中,用于"显示智能体某一步策略表现"的反馈信号是?( )
A. 特征
B. 数据集
C. 奖励
D. 模型
学科:默认课程
时间:2026-05-21 01:53:33
相关题目
相关作业