Topic
#speech-to-text
按主题聚合的新闻视图。
Topic Feed
主题:speech-to-text
共 1 条

微软发布VibeVoice:带说话人分离的开源语音转文字模型
微软发布了VibeVoice,这是一个新的MIT许可证语音转文字模型,内置说话人分离功能,并针对本地推理进行了优化。它支持.wav和.mp3文件,可在M5 Max芯片的Mac上约8分钟内完成一小时音频的转录。
Topic
按主题聚合的新闻视图。
Topic Feed
共 1 条

微软发布了VibeVoice,这是一个新的MIT许可证语音转文字模型,内置说话人分离功能,并针对本地推理进行了优化。它支持.wav和.mp3文件,可在M5 Max芯片的Mac上约8分钟内完成一小时音频的转录。