题海让大学四年没有难题
白天模式登陆

题目详情

单选题 为了让预训练后的模型变得有用、可靠并符合人类的价值观,需要进行哪两个关键的后续步骤?( )

A. 预训练 和 有监督微调 (SFT)

B. 有监督微调 (SFT) 和 基于人类反馈的强化学习 (RLHF)

C. 预训练 和 基于人类反馈的强化学习 (RLHF)

D. 增加参数 和 增加数据

课程封面

学科:

时间:2025-12-04 10:07:42

Copyright © 2022 津ICP备2021001502号