xAI API ra mắt chức năng sao chép giọng nói

robot
Đang tạo bản tóm tắt

AIMPACT Tin nhắn, ngày 2 tháng 5 (UTC+8), xAI gần đây đã ra mắt chức năng sao chép giọng nói thông qua API xAI. Người dùng có thể ghi âm khoảng một phút giọng nói tự nhiên trên bảng điều khiển, hệ thống sẽ hoàn tất xác minh quyền sở hữu giọng nói và xử lý ghi âm trong vòng hai phút, tạo ra mô hình giọng nói cấp sản xuất. Giọng nói sao chép hỗ trợ nhãn giọng nói, xuất đa ngôn ngữ cũng như truyền phát theo REST và WebSocket, có thể sử dụng giống như tất cả các giọng nói tích hợp sẵn (hơn 80 loại, bao phủ 28 ngôn ngữ). Về mặt an ninh, áp dụng xác thực hai giai đoạn: đầu tiên xác thực bằng cách đọc chính xác câu để đối chiếu chuyển đổi giọng nói theo thời gian thực, sau đó tính toán nhúng người nói từ đoạn xác thực và ghi âm đầy đủ để xác nhận danh tính. Người dùng không thể sao chép giọng nói từ ghi âm đã có, cũng như không thể sao chép giọng nói của người khác. API TTS hoặc đại lý giọng nói sử dụng giọng nói tùy chỉnh không yêu cầu phí bổ sung. (Nguồn: InFoQ)

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim