题目详情
单选题 以下哪种方法用于对齐智能体行为与人类价值观?( )
A. 强化学习人类反馈(RLHF)
B. 随机梯度下降(SGD)
C. 对抗生成网络(GAN)
D. 主成分分析(PCA)
学科:
时间:2025-06-29 00:00:43
相关题目