Cohere发布开源语音识别模型Transcribe,登顶基准测试榜首
The Decoder··作者 Matthias Bastian
收录于 2026-03-28

关键信息
Transcribe是一个拥有20亿参数的模型,支持包括英语、德语、法语和日语在内的14种语言;它在Hugging Face上以Apache 2.0许可证提供,并可通过Cohere的API和Model Vault平台访问。
资讯摘要
Cohere推出了Transcribe,这是一个开源自动语音识别模型,在Hugging Face开放ASR排行榜上以5.42%的词错误率击败了主要竞争对手。该模型支持14种语言,运行高效且吞吐量高,采用Apache 2.0许可证,可自由使用和修改。用户可以从Hugging Face下载或通过Cohere的API与Model Vault平台访问。
Cohere计划将其集成到North AI代理平台中,表明其战略重要性。此次发布标志着开源语音识别领域的重要进展,也使Cohere成为可负担AI基础设施的关键参与者。
资讯正文
加拿大人工智能公司Cohere发布了名为“Transcribe”的新型开源自动语音识别模型。该公司表示,该模型在Hugging Face的开放ASR排行榜上以平均词错误率5.42%的成绩位居榜首,击败了OpenAI的Whisper Large v3、ElevenLabs的Scribe v2以及Qwen3-ASR-1.7B等竞争对手。Cohere还称,Transcribe在同类规模模型中拥有最佳吞吐量。
Cohere Transcribe与其他七种语音识别模型进行了对比。图表中越靠近左上角的模型表现越好,意味着更高的吞吐量和更低的词错误率。| 图片来源:Cohere
这款参数为20亿的模型支持14种语言,包括英语、德语、法语和日语。它可在Hugging Face平台上以Apache 2.0许可证免费下载,也可通过Cohere的API和Model Vault平台访问。未来,Cohere计划将Transcribe集成到其AI代理平台North中。
AI新闻无夸大——由人类精选
作为THE DECODER订阅者,您可享受无广告阅读、每周AI通讯、独家《AI雷达》前沿报告(每年6次)、评论区访问权限及完整档案库。
热门新闻
Luma AI的Uni-1可能是首个真正挑战谷歌Nano Banana图像主导地位的模型
Anthropic泄露信息显示新模型“Claude Mythos”在测试中得分远超以往任何模型
据报道,OpenAI首席执行官山姆·阿尔特曼内部透露一款“非常强大”的模型,能“真正加速经济”
OpenAI发布提示指南,帮助设计师从GPT-5.4中获得更好的前端结果
Meta收购Dreamer全部团队,以加强其落后的AI代理发展计划
别错过重要信息
紧跟AI动态,清晰实用,毫无冗余。
最受欢迎内容
谷歌工程师称,Claude Code在一小时内完成的工作,她的团队花了整整一年时间
勒昆在离开Meta创办自己的初创公司时表示:“你当然不会告诉像我这样的研究员该做什么”
前OpenAI研究员指出当前AI模型无法从错误中学习,认为这是通往通用人工智能(AGI)的障碍
OpenClaw(原Clawdbot)和Moltbook让攻击者能轻松绕过安全防线
研究表明,一张打印标识牌就能劫持自动驾驶汽车并将其引向行人
据报道,GPT-5.4带来了百万token上下文窗口和极端推理模式
AI社区与洞察
The Decoder
关注The Decoder获取AI新闻、背景故事及专家分析。
配图

Tag
来源与参考