Topic

#multimodal-ai

按主题聚合的新闻视图。

主题:multimodal-ai

共 1 条

  1. 字节研究发现问答优于转录训练长文档

    The Decoder·

    字节研究发现问答优于转录训练长文档

    字节跳动 Seed 和香港科技大学的研究人员报告称,做长文档理解训练时,多模态模型从问答监督中学到的效果明显优于纯文本转录。基于这一方法,他们在阿里巴巴开源的 Qwen2.5-VL 上构建了 MMProLong,并称其表现超过了更大的开源模型。