题目详情
单选题 为了让预训练后的模型变得有用、可靠并符合人类的价值观,需要进行哪两个关键的后续步骤?( )
A. 预训练 和 有监督微调 (SFT)
B. 有监督微调 (SFT) 和 基于人类反馈的强化学习 (RLHF)
C. 预训练 和 基于人类反馈的强化学习 (RLHF)
D. 增加参数 和 增加数据
学科:
时间:2025-12-04 10:07:42
相关题目
相关作业