题目详情
多选题 在无模型设定的强化学习中,马尔可夫决策过程的五元组已知部分有( )
A. 有限状态集合S
B. 有限动作集合A
C. 状态转移函数P
D. 奖励函数R
E. 衰减因子
学科:[共享课]人工智能
时间:2024-11-25 00:37:17
相关题目