Cohere发布开源语音识别模型Transcribe,登顶基准测试榜首

The Decoder··作者 Matthias Bastian

关键信息

Transcribe是一个拥有20亿参数的模型,支持包括英语、德语、法语和日语在内的14种语言;它在Hugging Face上以Apache 2.0许可证提供,并可通过Cohere的API和Model Vault平台访问。

资讯摘要

Cohere推出了Transcribe,这是一个开源自动语音识别模型,在Hugging Face开放ASR排行榜上以5.42%的词错误率击败了主要竞争对手。该模型支持14种语言,运行高效且吞吐量高,采用Apache 2.0许可证,可自由使用和修改。用户可以从Hugging Face下载或通过Cohere的API与Model Vault平台访问。

Cohere计划将其集成到North AI代理平台中,表明其战略重要性。此次发布标志着开源语音识别领域的重要进展,也使Cohere成为可负担AI基础设施的关键参与者。

Cohere发布开源语音识别模型Transcribe,登顶基准测试榜首

资讯正文

Cohere发布开源模型 在语音识别基准测试中排名第一

加拿大人工智能公司Cohere发布了名为“Transcribe”的新型开源自动语音识别模型。该公司表示,该模型在Hugging Face的Open ASR排行榜上以平均词错误率5.42%位居榜首,击败了OpenAI的Whisper Large v3、ElevenLabs的Scribe v2以及Qwen3-ASR-1.7B等竞争对手。Cohere称,Transcribe在同等规模模型中还提供了最佳吞吐量。

Cohere Transcribe与其他七种语音识别模型的对比图显示,越靠近左上角的模型性能越好,意味着更低的词错误率和更高的吞吐量。| 图片来源:Cohere

这款拥有20亿参数的模型支持14种语言,包括英语、德语、法语和日语。该模型可在Hugging Face上以Apache 2.0许可证免费下载,也可通过Cohere的API及Model Vault平台获取。Cohere计划未来将Transcribe集成到其AI代理平台North中。

AI新闻,无夸大成分——由人类精选

来源与参考

  1. 原始链接
  2. Cohere releases open source model that tops speech recognition benchmarks

收录于 2026-03-28