登陆

题目详情

单选题为了让预训练后的模型变得有用、可靠并符合人类的价值观,需要进行哪两个关键的后续步骤?( )

A. 预训练和有监督微调 (SFT)

B. 有监督微调 (SFT) 和基于人类反馈的强化学习 (RLHF)

C. 预训练和基于人类反馈的强化学习 (RLHF)

D. 增加参数和增加数据

课程封面

学科：

时间：2025-12-04 10:07:42

下载题海APP

拍照搜题更快捷

海量题库
无搜索限制
快捷拍照搜题

扫描他！然后带走我～