xAI推出自定义声音功能,2分钟内即可克隆你的声音

The Decoder··作者 Matthias Bastian

关键信息

声音模型可在两分钟内生成,并可直接集成到xAI的文字转语音和语音代理API中。使用克隆声音不额外收费。

资讯摘要

xAI推出了名为'自定义声音'的新功能,允许用户仅用一分钟自然语音即可克隆自己的声音。整个过程不到两分钟,之后模型可直接用于xAI的文字转语音和语音代理API。为防止滥用,系统采用两步验证:首先用户需实时朗读一段密码短语,然后系统比对两次录音的声音特征以确认是同一个人。

这确保无法克隆已有的录音或他人声音。xAI控制台还新增了一个包含80多种预装声音的'语音库',覆盖28种语言。该功能基于xAI最近推出的Grok语音识别与文字转语音API,以及Grok语音思考快1.0语音代理模型,后者目前已用于Starlink的客户服务和销售。

xAI推出自定义声音功能,2分钟内即可克隆你的声音

资讯正文

xAI的新功能‘自定义声音’可将一分钟的语音转化为可用的声音克隆

xAI推出了名为‘自定义声音’的新功能,让用户仅需一段简短录音即可克隆自己的声音。只需通过xAI控制台录制大约一分钟的自然语音,系统便能在两分钟内完成语音模型的训练,并可直接接入该公司的文本转语音和语音代理API。

为防止滥用,xAI采用双重验证流程:用户首先朗读一段密码,系统实时检测其发音;随后,系统比对两次录音中的声音特征,确认是同一人发声。xAI表示,这一设置使得克隆现有录音或他人声音变得不可能。

xAI控制台还新增了一个‘声音库’,内置超过80种预装声音,涵盖28种语言。使用克隆声音不额外收费。

‘自定义声音’功能基于xAI最近推出的Grok语音识别与文本转语音API,以及‘Grok Voice Think Fast 1.0’语音代理模型——xAI称该模型已用于Starlink客户支持和销售服务。

AI新闻,无炒作——由人类精选

来源与参考

  1. 原始链接
  2. xAI's new Custom Voices feature turns a minute of speech into a usable voice clone

收录于 2026-05-03