Topic

#speech-to-text

按主题聚合的新闻视图。

Topic Feed

主题：speech-to-text

共 1 条

Simon Willison·4月28日 07:46 UTC
微软发布VibeVoice：带说话人分离的开源语音转文字模型
微软发布了VibeVoice，这是一个新的MIT许可证语音转文字模型，内置说话人分离功能，并针对本地推理进行了优化。它支持.wav和.mp3文件，可在M5 Max芯片的Mac上约8分钟内完成一小时音频的转录。
#speech-to-text评分 8.0