Topic

#speech-to-text

按主题聚合的新闻视图。

主题:speech-to-text

共 1 条

  1. 微软发布VibeVoice:带说话人分离的开源语音转文字模型

    Simon Willison·

    微软发布VibeVoice:带说话人分离的开源语音转文字模型

    微软发布了VibeVoice,这是一个新的MIT许可证语音转文字模型,内置说话人分离功能,并针对本地推理进行了优化。它支持.wav和.mp3文件,可在M5 Max芯片的Mac上约8分钟内完成一小时音频的转录。