登陆

题目详情

单选题大语言模型训练流程中,主要目标是"对齐人类偏好与价值观"的阶段是?( )

A. 预训练 (Pre-training)

B. 有监督微调 (SFT)

C. 基于人类反馈的强化学习 (RLHF)

D. 数据清洗

undefined课程封面

学科：

时间：2026-01-12 14:14:15

下载题海APP

拍照搜题更快捷

海量题库
无搜索限制
快捷拍照搜题

扫描他！然后带走我～