题目详情
单选题 在本章内容范围内,"在状态,按照某个策略行动后在未来所获得回报值的期望",这句话描述了状态的( B );"在状态,按照某个策略采取动作后在未来所获得回报值的期望",这句话描述了状态的( )
A. 策略优化
B. 价值函数
C. 动作-价值函数
D. 采样函数
学科:[智慧共享课]人工智能引论
时间:2024-05-09 00:56:22
相关题目
相关作业