Grok上线声音克隆:录一分钟,就能做自己的AI声线

robot
摘要生成中

据动察 Beating 监测,xAI 推出 Grok Custom Voices 和 Voice Library。用户可以在 xAI 控制台录一段声音,生成自己的 voice_id,再接入 Grok TTS 或 Voice Agent API,用于客服 agent、内容创作、游戏角色、有声书旁白等场景。

这套功能不是简单上传音频就能克隆。用户需要朗读验证短句,系统会用 STT 做实时转写,并比对验证录音和完整录音的说话人特征,确认是同一个人后才生成声线。xAI 称,这样可以防止用现成录音克隆他人声音。

目前 Custom Voices 只在美国开放,伊利诺伊州除外。控制台最多可免费创建 30 个自定义声音,API 创建能力只开放给 Enterprise 团队。自定义声音本身不额外收费,但调用语音 API 仍按量计费:Realtime 为 $3.00/小时,Text to Speech 为 $4.20/百万字符。

此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论