题海
让大学四年没有难题
首页
搜题
登陆
题目详情
判断题
强化学习中的agent通过不断与环境交互来获取反馈,最终获得一个最优策略.( )
A.
对
B.
错
查看答案
学科:
时间:
2025-04-28 09:37:13
相关题目
相关作业
题目1
判断题
强化学习中的agent通过不断与环境交互来获取反馈,最终获得一个最优策略.( )
A. 对
B. 错
题目2
多选题
以下哪些是强化学习的特征?( )
A. 通过环境反馈学习
B. 需要大量的标注数据
C. 强化学习 agent 通过与环境的互动获得奖励
D. 主要依赖训练集的标签数据
题目3
多选题
以下哪些算法属于监督学习?( )
A. 线性回归
B. K-means聚类
C. 支持向量机(SVM)
D. 决策树
题目4
单选题
在监督学习中,训练数据通常包含以下哪一项?( )
A. 未标注数据
B. 标注数据
C. 模型权重
D. 随机数据
题目5
单选题
以下哪种算法属于非监督学习?( )
A. K-近邻算法
B. 支持向量机
C. K-means聚类
D. 决策树
下载
题海APP
拍照搜题更快捷
海量题库
无搜索限制
快捷拍照搜题
扫描他!然后带走我~