TTSGoogle CloudAmazon PollyCloud Servicesสอน AI

Google TTS vs Amazon Polly: เปรียบเทียบ Cloud TTS

เปรียบเทียบ Google Cloud Text-to-Speech กับ Amazon Polly สอง Cloud TTS ยักษ์ใหญ่ พร้อมวิเคราะห์ข้อดีข้อเสียและราคา

AI Unlocked Team
21/03/2568
Google TTS vs Amazon Polly: เปรียบเทียบ Cloud TTS

Google TTS vs Amazon Polly: เปรียบเทียบ Cloud TTS

ถ้าคุณเป็น Developer หรือต้องการ TTS สำหรับ Production ระดับ Enterprise การเลือกระหว่าง Google Cloud TTS และ Amazon Polly เป็นคำถามที่พบบ่อยค่ะ วันนี้มาเปรียบเทียบกันให้ชัดเจน!

ภาพรวม

Google Cloud Text-to-Speech

เป็น TTS Service จาก Google Cloud Platform ใช้ WaveNet และ Neural2 Technology

Amazon Polly

เป็น TTS Service จาก AWS (Amazon Web Services) ใช้ Neural TTS Technology

เปรียบเทียบฟีเจอร์

FeatureGoogle Cloud TTSAmazon Polly
Voice TypesWaveNet, Neural2, StandardNeural, Standard, Long-form
Languages50+30+
Voices220+60+
SSML Support
Neural Qualityดีเยี่ยมดีมาก
ภาษาไทย
Real-time
Long-formจำกัด✅ (Long-form voices)

Google Cloud TTS

Voice Types

1. Standard Voices

  • คุณภาพพื้นฐาน
  • ราคาถูกที่สุด
  • เหมาะกับงานทั่วไป

2. WaveNet Voices

  • คุณภาพสูง
  • เสียงสมจริงมาก
  • ราคาสูงกว่า Standard

3. Neural2 Voices

  • คุณภาพสูงสุด
  • เสียงเป็นธรรมชาติที่สุด
  • ราคาสูงที่สุด

ราคา Google Cloud TTS

Voice Typeราคา (ต่อ 1 ล้าน Characters)
Standard$4
WaveNet$16
Neural2$16

Free Tier: 4 ล้าน Characters/เดือน (Standard) หรือ 1 ล้าน Characters (WaveNet/Neural2)

วิธีใช้ Google Cloud TTS

Step 1: Setup Project

  1. ไปที่ Google Cloud Console
  2. สร้าง Project ใหม่
  3. Enable Text-to-Speech API
  4. สร้าง Service Account และ Download Key

Step 2: Install SDK

pip install google-cloud-texttospeech

Step 3: Code Example

from google.cloud import texttospeech

client = texttospeech.TextToSpeechClient()

synthesis_input = texttospeech.SynthesisInput(text="สวัสดีครับ")

voice = texttospeech.VoiceSelectionParams(
    language_code="th-TH",
    name="th-TH-Neural2-C"
)

audio_config = texttospeech.AudioConfig(
    audio_encoding=texttospeech.AudioEncoding.MP3
)

response = client.synthesize_speech(
    input=synthesis_input, voice=voice, audio_config=audio_config
)

with open("output.mp3", "wb") as out:
    out.write(response.audio_content)

Amazon Polly

Voice Types

1. Standard Voices

  • คุณภาพพื้นฐาน
  • ราคาถูก

2. Neural Voices

  • คุณภาพสูง
  • เสียงสมจริง
  • มี "Newscaster" style

3. Long-form Voices

  • ออกแบบสำหรับเนื้อหายาว
  • เหมาะกับ Audiobook

ราคา Amazon Polly

Voice Typeราคา (ต่อ 1 ล้าน Characters)
Standard$4
Neural$16
Long-form$100

Free Tier: 5 ล้าน Characters/เดือน (12 เดือนแรก)

วิธีใช้ Amazon Polly

Step 1: Setup AWS

  1. สมัคร AWS Account
  2. สร้าง IAM User
  3. กำหนด Permission สำหรับ Polly
  4. Download Access Key

Step 2: Install SDK

pip install boto3

Step 3: Code Example

import boto3

polly = boto3.client('polly')

response = polly.synthesize_speech(
    Text='สวัสดีครับ',
    OutputFormat='mp3',
    VoiceId='Filiz',  # เลือก Voice ID
    Engine='neural'
)

with open('output.mp3', 'wb') as file:
    file.write(response['AudioStream'].read())

เปรียบเทียบคุณภาพ

ภาษาอังกฤษ

  • Google Neural2: ดีเยี่ยม สมจริงมาก
  • Amazon Neural: ดีมาก มี Newscaster style

ภาษาไทย

  • Google: มี Neural2 Voice คุณภาพดี
  • Amazon: มี Standard Voice คุณภาพปานกลาง

ภาษาอื่นๆ

  • Google: รองรับมากกว่า (50+ ภาษา)
  • Amazon: รองรับน้อยกว่า (30+ ภาษา)

SSML Support

ทั้งคู่รองรับ SSML (Speech Synthesis Markup Language):

<speak>
  สวัสดี <break time="500ms"/>
  <emphasis level="strong">ยินดีต้อนรับ</emphasis>
  <prosody rate="slow">กรุณารอสักครู่</prosody>
</speak>

SSML Features

FeatureGoogleAmazon Polly
Break
Emphasis
Prosody
Say-as
Sub
Phoneme

Use Cases

เมื่อไหร่เลือก Google Cloud TTS

  1. ต้องการภาษาหลากหลาย - รองรับมากกว่า
  2. ใช้ Google Cloud อยู่แล้ว - Integration ง่าย
  3. ต้องการ WaveNet/Neural2 - คุณภาพสูงมาก
  4. ต้องการภาษาไทยคุณภาพดี

เมื่อไหร่เลือก Amazon Polly

  1. ใช้ AWS อยู่แล้ว - Integration ง่าย
  2. ต้องการ Long-form Content - มี Long-form voices
  3. ต้องการ Newscaster Style
  4. Free Tier ดีกว่า (5 ล้าน vs 1-4 ล้าน)

Integration กับ Services อื่น

Google Cloud TTS

  • Cloud Functions
  • App Engine
  • Kubernetes Engine
  • Cloud Run

Amazon Polly

  • Lambda
  • S3
  • CloudFront
  • Alexa Skills

สรุปการเปรียบเทียบ

CriteriaWinner
Voice Quality (EN)เสมอกัน
Voice Quality (TH)Google
Language SupportGoogle
Priceเสมอกัน
Free TierAmazon
Long-formAmazon
Integrationขึ้นกับ Cloud ที่ใช้

แนะนำการเลือก

เลือก Google Cloud TTS ถ้า:

  • ต้องการภาษาไทยคุณภาพดี
  • ต้องการภาษาหลากหลาย
  • ใช้ Google Cloud อยู่แล้ว

เลือก Amazon Polly ถ้า:

  • ใช้ AWS อยู่แล้ว
  • ต้องการทำ Audiobook
  • ต้องการ Free Tier มากกว่า

สรุป

ทั้ง Google Cloud TTS และ Amazon Polly เป็น Cloud TTS ที่ดีมากค่ะ การเลือกขึ้นอยู่กับ Cloud Platform ที่ใช้อยู่ ภาษาที่ต้องการ และ Use Case ถ้าไม่แน่ใจ แนะนำให้ลองใช้ Free Tier ของทั้งสองก่อนตัดสินใจ

ถ้าอยากเรียนรู้การใช้ Cloud TTS และ AI Voice Services สำหรับ Production สามารถมาเรียน คอร์ส AI ของเราได้ค่ะ เรา สอน AI เชียงใหม่ ทั้ง Online และ Onsite ดูรายละเอียดได้ที่ หน้าคอร์สเรียน ค่ะ

เขียนโดย

AI Unlocked Team

บทความอื่นๆ ที่น่าสนใจ