Google TTS vs Amazon Polly: เปรียบเทียบ Cloud TTS
ถ้าคุณเป็น Developer หรือต้องการ TTS สำหรับ Production ระดับ Enterprise การเลือกระหว่าง Google Cloud TTS และ Amazon Polly เป็นคำถามที่พบบ่อยค่ะ วันนี้มาเปรียบเทียบกันให้ชัดเจน!
ภาพรวม
Google Cloud Text-to-Speech
เป็น TTS Service จาก Google Cloud Platform ใช้ WaveNet และ Neural2 Technology
Amazon Polly
เป็น TTS Service จาก AWS (Amazon Web Services) ใช้ Neural TTS Technology
เปรียบเทียบฟีเจอร์
| Feature | Google Cloud TTS | Amazon Polly |
|---|---|---|
| Voice Types | WaveNet, Neural2, Standard | Neural, Standard, Long-form |
| Languages | 50+ | 30+ |
| Voices | 220+ | 60+ |
| SSML Support | ✅ | ✅ |
| Neural Quality | ดีเยี่ยม | ดีมาก |
| ภาษาไทย | ✅ | ✅ |
| Real-time | ✅ | ✅ |
| Long-form | จำกัด | ✅ (Long-form voices) |
Google Cloud TTS
Voice Types
1. Standard Voices
- คุณภาพพื้นฐาน
- ราคาถูกที่สุด
- เหมาะกับงานทั่วไป
2. WaveNet Voices
- คุณภาพสูง
- เสียงสมจริงมาก
- ราคาสูงกว่า Standard
3. Neural2 Voices
- คุณภาพสูงสุด
- เสียงเป็นธรรมชาติที่สุด
- ราคาสูงที่สุด
ราคา Google Cloud TTS
| Voice Type | ราคา (ต่อ 1 ล้าน Characters) |
|---|---|
| Standard | $4 |
| WaveNet | $16 |
| Neural2 | $16 |
Free Tier: 4 ล้าน Characters/เดือน (Standard) หรือ 1 ล้าน Characters (WaveNet/Neural2)
วิธีใช้ Google Cloud TTS
Step 1: Setup Project
- ไปที่ Google Cloud Console
- สร้าง Project ใหม่
- Enable Text-to-Speech API
- สร้าง Service Account และ Download Key
Step 2: Install SDK
pip install google-cloud-texttospeech
Step 3: Code Example
from google.cloud import texttospeech
client = texttospeech.TextToSpeechClient()
synthesis_input = texttospeech.SynthesisInput(text="สวัสดีครับ")
voice = texttospeech.VoiceSelectionParams(
language_code="th-TH",
name="th-TH-Neural2-C"
)
audio_config = texttospeech.AudioConfig(
audio_encoding=texttospeech.AudioEncoding.MP3
)
response = client.synthesize_speech(
input=synthesis_input, voice=voice, audio_config=audio_config
)
with open("output.mp3", "wb") as out:
out.write(response.audio_content)
Amazon Polly
Voice Types
1. Standard Voices
- คุณภาพพื้นฐาน
- ราคาถูก
2. Neural Voices
- คุณภาพสูง
- เสียงสมจริง
- มี "Newscaster" style
3. Long-form Voices
- ออกแบบสำหรับเนื้อหายาว
- เหมาะกับ Audiobook
ราคา Amazon Polly
| Voice Type | ราคา (ต่อ 1 ล้าน Characters) |
|---|---|
| Standard | $4 |
| Neural | $16 |
| Long-form | $100 |
Free Tier: 5 ล้าน Characters/เดือน (12 เดือนแรก)
วิธีใช้ Amazon Polly
Step 1: Setup AWS
- สมัคร AWS Account
- สร้าง IAM User
- กำหนด Permission สำหรับ Polly
- Download Access Key
Step 2: Install SDK
pip install boto3
Step 3: Code Example
import boto3
polly = boto3.client('polly')
response = polly.synthesize_speech(
Text='สวัสดีครับ',
OutputFormat='mp3',
VoiceId='Filiz', # เลือก Voice ID
Engine='neural'
)
with open('output.mp3', 'wb') as file:
file.write(response['AudioStream'].read())
เปรียบเทียบคุณภาพ
ภาษาอังกฤษ
- Google Neural2: ดีเยี่ยม สมจริงมาก
- Amazon Neural: ดีมาก มี Newscaster style
ภาษาไทย
- Google: มี Neural2 Voice คุณภาพดี
- Amazon: มี Standard Voice คุณภาพปานกลาง
ภาษาอื่นๆ
- Google: รองรับมากกว่า (50+ ภาษา)
- Amazon: รองรับน้อยกว่า (30+ ภาษา)
SSML Support
ทั้งคู่รองรับ SSML (Speech Synthesis Markup Language):
<speak>
สวัสดี <break time="500ms"/>
<emphasis level="strong">ยินดีต้อนรับ</emphasis>
<prosody rate="slow">กรุณารอสักครู่</prosody>
</speak>
SSML Features
| Feature | Amazon Polly | |
|---|---|---|
| Break | ✅ | ✅ |
| Emphasis | ✅ | ✅ |
| Prosody | ✅ | ✅ |
| Say-as | ✅ | ✅ |
| Sub | ✅ | ✅ |
| Phoneme | ✅ | ✅ |
Use Cases
เมื่อไหร่เลือก Google Cloud TTS
- ต้องการภาษาหลากหลาย - รองรับมากกว่า
- ใช้ Google Cloud อยู่แล้ว - Integration ง่าย
- ต้องการ WaveNet/Neural2 - คุณภาพสูงมาก
- ต้องการภาษาไทยคุณภาพดี
เมื่อไหร่เลือก Amazon Polly
- ใช้ AWS อยู่แล้ว - Integration ง่าย
- ต้องการ Long-form Content - มี Long-form voices
- ต้องการ Newscaster Style
- Free Tier ดีกว่า (5 ล้าน vs 1-4 ล้าน)
Integration กับ Services อื่น
Google Cloud TTS
- Cloud Functions
- App Engine
- Kubernetes Engine
- Cloud Run
Amazon Polly
- Lambda
- S3
- CloudFront
- Alexa Skills
สรุปการเปรียบเทียบ
| Criteria | Winner |
|---|---|
| Voice Quality (EN) | เสมอกัน |
| Voice Quality (TH) | |
| Language Support | |
| Price | เสมอกัน |
| Free Tier | Amazon |
| Long-form | Amazon |
| Integration | ขึ้นกับ Cloud ที่ใช้ |
แนะนำการเลือก
เลือก Google Cloud TTS ถ้า:
- ต้องการภาษาไทยคุณภาพดี
- ต้องการภาษาหลากหลาย
- ใช้ Google Cloud อยู่แล้ว
เลือก Amazon Polly ถ้า:
- ใช้ AWS อยู่แล้ว
- ต้องการทำ Audiobook
- ต้องการ Free Tier มากกว่า
สรุป
ทั้ง Google Cloud TTS และ Amazon Polly เป็น Cloud TTS ที่ดีมากค่ะ การเลือกขึ้นอยู่กับ Cloud Platform ที่ใช้อยู่ ภาษาที่ต้องการ และ Use Case ถ้าไม่แน่ใจ แนะนำให้ลองใช้ Free Tier ของทั้งสองก่อนตัดสินใจ
ถ้าอยากเรียนรู้การใช้ Cloud TTS และ AI Voice Services สำหรับ Production สามารถมาเรียน คอร์ส AI ของเราได้ค่ะ เรา สอน AI เชียงใหม่ ทั้ง Online และ Onsite ดูรายละเอียดได้ที่ หน้าคอร์สเรียน ค่ะ
เขียนโดย
AI Unlocked Team
บทความอื่นๆ ที่น่าสนใจ
วิธีติดตั้ง FFmpeg บน Windows และ Mac: คู่มือฉบับสมบูรณ์
เรียนรู้วิธีติดตั้ง FFmpeg บน Windows และ macOS พร้อมการตั้งค่า PATH อย่างละเอียด เพื่อใช้งานโปรแกรมตัดต่อวิดีโอและเสียงระดับมืออาชีพ
สรุป: เส้นทางการเรียนรู้ AI สำหรับคนไทย ฉบับสมบูรณ์
สรุปทุกสิ่งที่คนไทยต้องรู้เกี่ยวกับการเรียน AI ตั้งแต่เริ่มต้นจนถึงการหางานและพัฒนาอาชีพ รวมทุก resources และ tips ในที่เดียว
อนาคตของ AI ในอีก 5 ปี: แนวโน้มและการเปลี่ยนแปลงที่จะเกิดขึ้น
วิเคราะห์อนาคตของ AI ในช่วง 5 ปีข้างหน้า ทั้งด้านเทคโนโลยี การทำงาน ธุรกิจ และสังคม พร้อมวิธีเตรียมตัวรับมือ