Topic

#ai-alignment

按主题聚合的新闻视图。

主题:ai-alignment

共 1 条

  1. 先理解价值原因再学行为

    The Decoder·

    先理解价值原因再学行为

    Anthropic Fellows Program 的一项研究显示,如果语言模型先学习“为什么这些价值重要”的解释,再进行具体行为微调,它们会更好地内化预期价值。研究人员将这一中间阶段称为“Model Spec Midtraining”(MSM)。