xAI推出自定义声音功能,2分钟内即可克隆你的声音
The Decoder··作者 Matthias Bastian
关键信息
声音模型可在两分钟内生成,并可直接集成到xAI的文字转语音和语音代理API中。使用克隆声音不额外收费。
资讯摘要
xAI推出了名为'自定义声音'的新功能,允许用户仅用一分钟自然语音即可克隆自己的声音。整个过程不到两分钟,之后模型可直接用于xAI的文字转语音和语音代理API。为防止滥用,系统采用两步验证:首先用户需实时朗读一段密码短语,然后系统比对两次录音的声音特征以确认是同一个人。
这确保无法克隆已有的录音或他人声音。xAI控制台还新增了一个包含80多种预装声音的'语音库',覆盖28种语言。该功能基于xAI最近推出的Grok语音识别与文字转语音API,以及Grok语音思考快1.0语音代理模型,后者目前已用于Starlink的客户服务和销售。

资讯正文
xAI的新功能‘自定义声音’可将一分钟的语音转化为可用的声音克隆
xAI推出了名为‘自定义声音’的新功能,让用户仅需一段简短录音即可克隆自己的声音。只需通过xAI控制台录制大约一分钟的自然语音,系统便能在两分钟内完成语音模型的训练,并可直接接入该公司的文本转语音和语音代理API。
为防止滥用,xAI采用双重验证流程:用户首先朗读一段密码,系统实时检测其发音;随后,系统比对两次录音中的声音特征,确认是同一人发声。xAI表示,这一设置使得克隆现有录音或他人声音变得不可能。
xAI控制台还新增了一个‘声音库’,内置超过80种预装声音,涵盖28种语言。使用克隆声音不额外收费。
‘自定义声音’功能基于xAI最近推出的Grok语音识别与文本转语音API,以及‘Grok Voice Think Fast 1.0’语音代理模型——xAI称该模型已用于Starlink客户支持和销售服务。
AI新闻,无炒作——由人类精选
来源与参考
收录于 2026-05-03