xAI API запустило функцию голосового клонирования

robot
Генерация тезисов в процессе

AIMPACT сообщение, 2 мая (UTC+8), xAI недавно запустила функцию голосового клонирования через xAI API. Пользователи могут записать около одной минуты естественной речи в консоли, система за два минуты завершает проверку прав собственности на голос и обработку записи, создавая производственную модель голоса. Клонированный голос поддерживает голосовые метки, многоязычный вывод, а также потоковую передачу через REST и WebSocket, и может использоваться так же, как все встроенные голоса (более 80 видов, охватывающих 28 языков). В области безопасности применяется двухэтапная проверка: сначала осуществляется проверка фразы для реального времени с помощью распознавания речи, затем из проверочного фрагмента и полной записи вычисляются встраивания говорящего для подтверждения личности. Пользователи не могут клонировать голос из существующих записей и не могут клонировать чужие голоса. Использование API TTS или голосового прокси с пользовательским голосом без дополнительной платы. (Источник: InFoQ)

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить