题海让大学四年没有难题
白天模式登陆

题目详情

多选题 强化学习的近似的策略评估中,计算真值的方法有( )

A. 蒙特卡洛法

B. 梯度下降法

C. 牛顿法

D. 时序差分法

[共享课]人工智能课程封面

学科:[共享课]人工智能

时间:2024-11-25 01:45:47

Copyright © 2022 津ICP备2021001502号