Cohere发布开源语音识别模型Transcribe,登顶基准测试榜首

The Decoder··作者 Matthias Bastian

收录于 2026-03-28

Cohere发布开源语音识别模型Transcribe,登顶基准测试榜首

关键信息

Transcribe是一个拥有20亿参数的模型,支持包括英语、德语、法语和日语在内的14种语言;它在Hugging Face上以Apache 2.0许可证提供,并可通过Cohere的API和Model Vault平台访问。

资讯摘要

Cohere推出了Transcribe,这是一个开源自动语音识别模型,在Hugging Face开放ASR排行榜上以5.42%的词错误率击败了主要竞争对手。该模型支持14种语言,运行高效且吞吐量高,采用Apache 2.0许可证,可自由使用和修改。用户可以从Hugging Face下载或通过Cohere的API与Model Vault平台访问。

Cohere计划将其集成到North AI代理平台中,表明其战略重要性。此次发布标志着开源语音识别领域的重要进展,也使Cohere成为可负担AI基础设施的关键参与者。

资讯正文

加拿大人工智能公司Cohere发布了名为“Transcribe”的新型开源自动语音识别模型。该公司表示,该模型在Hugging Face的开放ASR排行榜上以平均词错误率5.42%的成绩位居榜首,击败了OpenAI的Whisper Large v3、ElevenLabs的Scribe v2以及Qwen3-ASR-1.7B等竞争对手。Cohere还称,Transcribe在同类规模模型中拥有最佳吞吐量。

Cohere Transcribe与其他七种语音识别模型进行了对比。图表中越靠近左上角的模型表现越好,意味着更高的吞吐量和更低的词错误率。| 图片来源:Cohere

这款参数为20亿的模型支持14种语言,包括英语、德语、法语和日语。它可在Hugging Face平台上以Apache 2.0许可证免费下载,也可通过Cohere的API和Model Vault平台访问。未来,Cohere计划将Transcribe集成到其AI代理平台North中。

AI新闻无夸大——由人类精选

作为THE DECODER订阅者,您可享受无广告阅读、每周AI通讯、独家《AI雷达》前沿报告(每年6次)、评论区访问权限及完整档案库。

热门新闻

Luma AI的Uni-1可能是首个真正挑战谷歌Nano Banana图像主导地位的模型

Anthropic泄露信息显示新模型“Claude Mythos”在测试中得分远超以往任何模型

据报道,OpenAI首席执行官山姆·阿尔特曼内部透露一款“非常强大”的模型,能“真正加速经济”

OpenAI发布提示指南,帮助设计师从GPT-5.4中获得更好的前端结果

Meta收购Dreamer全部团队,以加强其落后的AI代理发展计划

别错过重要信息

紧跟AI动态,清晰实用,毫无冗余。

最受欢迎内容

谷歌工程师称,Claude Code在一小时内完成的工作,她的团队花了整整一年时间

勒昆在离开Meta创办自己的初创公司时表示:“你当然不会告诉像我这样的研究员该做什么”

前OpenAI研究员指出当前AI模型无法从错误中学习,认为这是通往通用人工智能(AGI)的障碍

OpenClaw(原Clawdbot)和Moltbook让攻击者能轻松绕过安全防线

研究表明,一张打印标识牌就能劫持自动驾驶汽车并将其引向行人

据报道,GPT-5.4带来了百万token上下文窗口和极端推理模式

AI社区与洞察

The Decoder

关注The Decoder获取AI新闻、背景故事及专家分析。

配图

Cohere发布开源语音识别模型Transcribe,登顶基准测试榜首
Cohere发布开源语音识别模型Transcribe,登顶基准测试榜首

Tag

来源与参考

  1. 原始链接
  2. Cohere releases open source model that tops speech recognition benchmarks