Text To Speech AI From Google Cloud

  • Google Text-to-speech là gì?

Google Text-to-Speech là một dịch vụ của Google cho phép chuyển đổi văn bản thành giọng nói tự nhiên bằng sử dụng các công nghệ tổng hợp giọng nói. Nó cho phép ứng dụng và dịch vụ trực tuyến sử dụng khả năng đọc văn bản một cách tự động và sinh động.

  • Chi phí sử dụng dịch vụ:
Neural2 voices0 to 1 million bytesUS$0.000016 per byte (US$16 per 1 million bytes)
Polyglot (Preview) voices0 to 1 million bytesUS$0.000016 per byte (US$16 per 1 million bytes)
Studio (Preview) voices0 to 100 thousand bytesUS$0.00016 per byte (US$160 per 1 million bytes)
Standard voices0 to 4 million charactersUS$0.000004 per character (US$4 per 1 million characters)
WaveNet voices0 to 1 million charactersUS$0.000016 per character (US$16 per 1 million characters)
  • Ưu và nhược điểm:

– Ưu điểm:

  1. Giọng nói tự nhiên
  2. Hỗ trợ nhiều ngôn ngữ và giọng đọc 
  3. Độ linh hoạt và tích hợp dễ dàng
  4. Khả năng điều chỉnh giọng đọc

– Nhược điểm:

  1. Chi phí
  2. Phụ thuộc vào kết nối internet
  3. Độ trễ
  4. Giới hạn gói dịch vụ

Slide tham khảo:

Để lại một bình luận