xAI推出自定义声音功能，2分钟内即可克隆你的声音

The Decoder·5月2日 20:14 UTC·作者 Matthias Bastian

关键信息

声音模型可在两分钟内生成，并可直接集成到xAI的文字转语音和语音代理API中。使用克隆声音不额外收费。

资讯摘要

xAI推出了名为'自定义声音'的新功能，允许用户仅用一分钟自然语音即可克隆自己的声音。整个过程不到两分钟，之后模型可直接用于xAI的文字转语音和语音代理API。为防止滥用，系统采用两步验证：首先用户需实时朗读一段密码短语，然后系统比对两次录音的声音特征以确认是同一个人。

这确保无法克隆已有的录音或他人声音。xAI控制台还新增了一个包含80多种预装声音的'语音库'，覆盖28种语言。该功能基于xAI最近推出的Grok语音识别与文字转语音API，以及Grok语音思考快1.0语音代理模型，后者目前已用于Starlink的客户服务和销售。

资讯正文

xAI的新功能‘自定义声音’可将一分钟的语音转化为可用的声音克隆

xAI推出了名为‘自定义声音’的新功能，让用户仅需一段简短录音即可克隆自己的声音。只需通过xAI控制台录制大约一分钟的自然语音，系统便能在两分钟内完成语音模型的训练，并可直接接入该公司的文本转语音和语音代理API。

为防止滥用，xAI采用双重验证流程：用户首先朗读一段密码，系统实时检测其发音；随后，系统比对两次录音中的声音特征，确认是同一人发声。xAI表示，这一设置使得克隆现有录音或他人声音变得不可能。

xAI控制台还新增了一个‘声音库’，内置超过80种预装声音，涵盖28种语言。使用克隆声音不额外收费。

‘自定义声音’功能基于xAI最近推出的Grok语音识别与文本转语音API，以及‘Grok Voice Think Fast 1.0’语音代理模型——xAI称该模型已用于Starlink客户支持和销售服务。

AI新闻，无炒作——由人类精选

来源与参考