题目详情
多选题 强化学习的近似的策略评估中,计算真值的方法有( )
A. 蒙特卡洛法
B. 梯度下降法
C. 牛顿法
D. 时序差分法
学科:[共享课]人工智能
时间:2024-11-25 01:45:47
相关题目