题目
为了让预训练后的模型变得有用、可靠并符合人类的价值观,需要进行哪两个关键的后续步骤?()A. 增加参数和增加数据B. 预训练和有监督微调 (SFT)C. 预训练和基于人类反馈的强化学习 (RLHF)D. 有监督微调 (SFT) 和基于人类反馈的强化学习 (RLHF)
为了让预训练后的模型变得有用、可靠并符合人类的价值观,需要进行哪两个关键的后续步骤?()
A. 增加参数和增加数据
B. 预训练和有监督微调 (SFT)
C. 预训练和基于人类反馈的强化学习 (RLHF)
D. 有监督微调 (SFT) 和基于人类反馈的强化学习 (RLHF)
题目解答
答案
D. 有监督微调 (SFT) 和基于人类反馈的强化学习 (RLHF)