Cohere发布开源语音识别模型Transcribe，登顶基准测试榜首

The Decoder·3月28日 02:37 UTC·作者 Matthias Bastian

关键信息

Transcribe是一个拥有20亿参数的模型，支持包括英语、德语、法语和日语在内的14种语言；它在Hugging Face上以Apache 2.0许可证提供，并可通过Cohere的API和Model Vault平台访问。

资讯摘要

Cohere推出了Transcribe，这是一个开源自动语音识别模型，在Hugging Face开放ASR排行榜上以5.42%的词错误率击败了主要竞争对手。该模型支持14种语言，运行高效且吞吐量高，采用Apache 2.0许可证，可自由使用和修改。用户可以从Hugging Face下载或通过Cohere的API与Model Vault平台访问。

Cohere计划将其集成到North AI代理平台中，表明其战略重要性。此次发布标志着开源语音识别领域的重要进展，也使Cohere成为可负担AI基础设施的关键参与者。

资讯正文

Cohere发布开源模型在语音识别基准测试中排名第一

加拿大人工智能公司Cohere发布了名为“Transcribe”的新型开源自动语音识别模型。该公司表示，该模型在Hugging Face的Open ASR排行榜上以平均词错误率5.42%位居榜首，击败了OpenAI的Whisper Large v3、ElevenLabs的Scribe v2以及Qwen3-ASR-1.7B等竞争对手。Cohere称，Transcribe在同等规模模型中还提供了最佳吞吐量。

Cohere Transcribe与其他七种语音识别模型的对比图显示，越靠近左上角的模型性能越好，意味着更低的词错误率和更高的吞吐量。| 图片来源：Cohere

这款拥有20亿参数的模型支持14种语言，包括英语、德语、法语和日语。该模型可在Hugging Face上以Apache 2.0许可证免费下载，也可通过Cohere的API及Model Vault平台获取。Cohere计划未来将Transcribe集成到其AI代理平台North中。

AI新闻，无夸大成分——由人类精选

来源与参考

收录于 2026-03-28