Topic

#mixture-of-experts

按主题聚合的新闻视图。

主题:mixture-of-experts

共 1 条

  1. EMO仅用12.5%的专家仍保持接近完整性能

    The Decoder·

    EMO仅用12.5%的专家仍保持接近完整性能

    艾伦人工智能研究所和加州大学伯克利分校的研究人员开发了 EMO,这是一种混合专家语言模型,其内部模块会专门对应医学、政治等内容领域。在测试中,该模型在仅保留 25% 专家时性能只下降约 1 个百分点,保留 12.5% 专家时也只下降约 3 个百分点。