ChatGPT ทำงานอย่างไร? เข้าใจ LLM แบบง่ายๆ
ChatGPT กลายเป็นปรากฏการณ์ที่เปลี่ยนโลก AI ไปตลอดกาล ตั้งแต่เปิดตัวในปี 2022 มีผู้ใช้งานมากกว่า 100 ล้านคนภายในเวลาเพียง 2 เดือน แต่หลายคนอาจยังสงสัยว่า ChatGPT ทำงานอย่างไร? บทความนี้จะอธิบายให้เข้าใจง่าย แม้ไม่มีพื้นฐานเทคนิค
ChatGPT คืออะไร?
ChatGPT (Chat Generative Pre-trained Transformer) เป็น AI Chatbot ที่พัฒนาโดย OpenAI มันเป็น Large Language Model (LLM) หรือโมเดลภาษาขนาดใหญ่ที่สามารถ:
- สนทนาได้อย่างเป็นธรรมชาติ
- ตอบคำถามได้หลากหลายหัวข้อ
- เขียนเนื้อหา บทความ โค้ด
- แปลภาษา สรุปข้อมูล
- ช่วยคิดวิเคราะห์และแก้ปัญหา
หากต้องการความรู้พื้นฐานเกี่ยวกับ AI อ่าน AI คืออะไร? ความรู้พื้นฐานที่ทุกคนควรรู้
LLM (Large Language Model) คืออะไร?
Large Language Model คือโมเดล AI ที่:
- ถูกฝึกด้วยข้อมูลข้อความมหาศาล (หลายล้านล้านคำ)
- มี Parameters มหาศาล (GPT-4 มีประมาณ 1 ล้านล้าน parameters)
- สามารถเข้าใจและสร้างภาษามนุษย์ได้
เปรียบเทียบ LLM ยอดนิยม
| โมเดล | บริษัท | Parameters | จุดเด่น |
|---|---|---|---|
| GPT-4 | OpenAI | ~1.7 trillion | เก่งรอบด้าน, Multimodal |
| Claude 3 | Anthropic | ไม่เปิดเผย | ปลอดภัย, เขียนดี |
| Gemini | ไม่เปิดเผย | เชื่อมต่อ Google | |
| Llama 3 | Meta | 70B / 405B | Open Source |
| Mistral | Mistral AI | 7B-8x22B | เล็กแต่แรง |
หลักการทำงานของ ChatGPT
1. ทำนายคำถัดไป (Next Token Prediction)
หัวใจของ ChatGPT คือการ ทำนายคำถัดไป ที่น่าจะเกิดขึ้น:
Input: "สวัสดี วันนี้อากาศ"
ChatGPT คิด: คำถัดไปที่น่าจะเป็น...
- "ดี" (40%)
- "ร้อน" (25%)
- "เย็น" (15%)
- "แจ่มใส" (10%)
- อื่นๆ (10%)
Output: "ดี" (เลือกคำที่มีโอกาสสูงสุด)
2. Token คืออะไร?
Token คือหน่วยย่อยของข้อความที่ LLM เข้าใจ:
ประโยค: "สวัสดีครับ ผมชื่อ AI"
Tokenization:
["สวัสดี", "ครับ", " ผม", "ชื่อ", " AI"]
= 5 tokens
ภาษาอังกฤษ:
"Hello, my name is AI"
["Hello", ",", " my", " name", " is", " AI"]
= 6 tokens
3. Context Window
Context Window คือจำนวน tokens ที่ LLM สามารถ "จำ" ได้ในการสนทนาครั้งหนึ่ง:
| โมเดล | Context Window |
|---|---|
| GPT-3.5 | 4,096 tokens |
| GPT-4 | 8,192 - 128,000 tokens |
| Claude 3 | 200,000 tokens |
| Gemini 1.5 | 1,000,000 tokens |
สถาปัตยกรรม Transformer
ChatGPT ใช้สถาปัตยกรรม Transformer ที่ Google นำเสนอในปี 2017:
ส่วนประกอบหลัก
┌─────────────────────────────────────────┐
│ Transformer │
├─────────────────────────────────────────┤
│ │
│ ┌─────────────────────────────────┐ │
│ │ Output Layer │ │
│ │ (สร้างคำตอบ/ข้อความ) │ │
│ └─────────────────────────────────┘ │
│ ↑ │
│ ┌─────────────────────────────────┐ │
│ │ Transformer Layers │ │
│ │ (หลายสิบ-หลายร้อยชั้น) │ │
│ │ • Self-Attention │ │
│ │ • Feed Forward Network │ │
│ └─────────────────────────────────┘ │
│ ↑ │
│ ┌─────────────────────────────────┐ │
│ │ Embedding Layer │ │
│ │ (แปลงคำเป็นตัวเลข) │ │
│ └─────────────────────────────────┘ │
│ ↑ │
│ ┌─────────────────────────────────┐ │
│ │ Input │ │
│ │ (ข้อความที่ป้อนเข้า) │ │
│ └─────────────────────────────────┘ │
│ │
└─────────────────────────────────────────┘
Self-Attention คืออะไร?
Self-Attention ทำให้ AI เข้าใจความสัมพันธ์ระหว่างคำในประโยค:
ประโยค: "แมวตัวนี้ชอบนอนบนโซฟา มันน่ารักมาก"
Self-Attention เข้าใจว่า:
- "มัน" หมายถึง "แมว" (ไม่ใช่ "โซฟา")
- "น่ารัก" เชื่อมโยงกับ "แมว"
เปรียบเทียบ:
"หมาตัวนี้ไล่แมว มันวิ่งหนี"
- "มัน" หมายถึง "แมว" (ถูกไล่จึงหนี) หรือ "หมา" (ไล่จึงวิ่ง)?
- AI ต้องเข้าใจบริบท
3 ขั้นตอนการฝึก ChatGPT
ขั้นที่ 1: Pre-training (การฝึกล่วงหน้า)
- ข้อมูล: ข้อความจากอินเทอร์เน็ตมหาศาล (หนังสือ, เว็บไซต์, Wikipedia)
- วิธีการ: ให้ทำนายคำถัดไปจากข้อความ
- ผลลัพธ์: ได้ Base Model ที่เข้าใจภาษา
ฝึก: "ประเทศไทยมีเมืองหลวงคือ ____"
คำตอบ: "กรุงเทพมหานคร"
ทำซ้ำหลายล้านล้านครั้งกับข้อความต่างๆ
ขั้นที่ 2: Supervised Fine-Tuning (SFT)
- ข้อมูล: ตัวอย่างการสนทนาที่มนุษย์เขียน
- วิธีการ: ให้ AI เรียนรู้วิธีตอบคำถามแบบมนุษย์
ผู้ใช้: "วิธีทำผัดไทย?"
ผู้ช่วย: "นี่คือขั้นตอนการทำผัดไทย:
1. แช่เส้นในน้ำอุ่น 30 นาที
2. ผัดกุ้งกับกระเทียม
3. ใส่เส้นและปรุงรส..."
ขั้นที่ 3: RLHF (Reinforcement Learning from Human Feedback)
- ข้อมูล: มนุษย์ให้คะแนนคำตอบของ AI
- วิธีการ: ปรับ AI ให้ตอบแบบที่มนุษย์ชอบ
คำถาม: "อธิบาย Quantum Computing"
คำตอบ A: [อธิบายเทคนิคซับซ้อน]
คำตอบ B: [อธิบายด้วยตัวอย่างง่ายๆ]
มนุษย์ให้คะแนน: B > A
AI เรียนรู้: ควรอธิบายให้เข้าใจง่าย
GPT-4 กับความสามารถ Multimodal
GPT-4 และรุ่นใหม่ๆ เป็น Multimodal AI ที่เข้าใจได้หลายรูปแบบ:
รองรับหลายรูปแบบข้อมูล
- ข้อความ (Text): อ่าน เขียน แปล สรุป
- รูปภาพ (Image): วิเคราะห์ อธิบาย ตอบคำถามจากรูป
- เสียง (Audio): GPT-4o รองรับการสนทนาด้วยเสียง
ตัวอย่างการใช้งาน Multimodal
ผู้ใช้: [อัปโหลดรูปเมนูร้านอาหาร]
"แนะนำอาหารสำหรับคนแพ้ถั่ว"
ChatGPT: "จากเมนูนี้ อาหารที่ปลอดภัยสำหรับคนแพ้ถั่วคือ:
1. ผัดไทยกุ้ง (ไม่มีถั่ว)
2. ต้มยำกุ้ง
⚠️ หลีกเลี่ยง: ผัดถั่วลิสง, ก๋วยเตี๋ยวราดหน้า (มีถั่วลิสงบด)"
ChatGPT รู้ได้อย่างไร?
สิ่งที่ ChatGPT "รู้"
ChatGPT ไม่ได้ "รู้" หรือ "เข้าใจ" จริงๆ แต่:
- Pattern Recognition: จดจำ patterns จากข้อมูลที่เรียนมา
- Statistical Correlation: เข้าใจความสัมพันธ์ทางสถิติระหว่างคำ
- Learned Associations: เชื่อมโยงแนวคิดจากการฝึก
ตัวอย่าง
ถาม: "ดวงอาทิตย์ขึ้นทางทิศไหน?"
ChatGPT ไม่ได้ "รู้" ว่าดวงอาทิตย์คืออะไร
แต่เห็นว่าในข้อมูลการฝึก:
- "ดวงอาทิตย์ขึ้นทางทิศตะวันออก" ปรากฏบ่อยมาก
- "ดวงอาทิตย์ขึ้นทางทิศตะวันตก" แทบไม่มี
จึงตอบว่า: "ทิศตะวันออก"
ข้อจำกัดของ ChatGPT
1. Hallucination (การสร้างข้อมูลเท็จ)
ChatGPT อาจ สร้างข้อมูลที่ดูน่าเชื่อแต่ไม่จริง:
ถาม: "บอกหนังสือ AI ของ John Smith ปี 2020"
ChatGPT อาจตอบ:
"หนังสือ 'AI Revolution' โดย John Smith ตีพิมพ์ปี 2020
ครอบคลุมเรื่อง Machine Learning และ Neural Networks..."
⚠️ ปัญหา: อาจไม่มีหนังสือนี้จริง!
2. Knowledge Cutoff (ความรู้มีวันหมดอายุ)
- ChatGPT มี Knowledge Cutoff (วันที่ข้อมูลสิ้นสุด)
- ไม่รู้เหตุการณ์หลังวันนั้น (ยกเว้นใช้ Browsing)
3. ไม่มี Common Sense แท้จริง
ถาม: "ถ้าใส่ช้างในตู้เย็น ต้องทำอย่างไร?"
ChatGPT อาจตอบอย่างจริงจัง:
"1. เปิดประตูตู้เย็น
2. ใส่ช้างเข้าไป
3. ปิดประตู"
⚠️ ไม่เข้าใจว่าเป็นเรื่องตลก/เป็นไปไม่ได้
4. ไม่มี Memory ระยะยาว
- ChatGPT ไม่จำการสนทนาก่อนหน้า (ยกเว้น Custom Instructions)
- แต่ละ session เริ่มใหม่
เปรียบเทียบ ChatGPT กับ AI อื่น
| ฟีเจอร์ | ChatGPT | Claude | Gemini |
|---|---|---|---|
| บริษัท | OpenAI | Anthropic | |
| จุดเด่น | เก่งรอบด้าน | ปลอดภัย, งานเขียน | เชื่อมต่อ Google |
| Multimodal | ใช่ (GPT-4) | ใช่ (Claude 3) | ใช่ |
| Context | 128K | 200K | 1M |
| ราคา | $20/เดือน | $20/เดือน | $20/เดือน |
อ่านเพิ่มเติมเกี่ยวกับ 10 AI Tools ที่ธุรกิจควรใช้ในปี 2025
เทคนิคการใช้ ChatGPT อย่างมีประสิทธิภาพ
1. เขียน Prompt ที่ดี
❌ Prompt ที่ไม่ดี:
"เขียนบทความ"
✅ Prompt ที่ดี:
"เขียนบทความเกี่ยวกับ 'วิธีลดน้ำหนักอย่างยั่งยืน'
- ความยาว 800 คำ
- กลุ่มเป้าหมาย: คนวัย 30-40 ปี
- โทน: เป็นกันเอง ให้กำลังใจ
- มีตัวอย่างจริง
- มี 5 ขั้นตอนหลัก"
อ่านเพิ่มเติม Prompt Engineering Mastery
2. ใช้ System Message / Custom Instructions
System: "คุณเป็นที่ปรึกษาการเงินมืออาชีพ
ตอบคำถามด้วยภาษาที่เข้าใจง่าย
ให้ตัวอย่างเป็นตัวเลขเสมอ
เตือนเรื่องความเสี่ยงทุกครั้ง"
3. ขอให้คิดทีละขั้น (Chain of Thought)
"ช่วยวิเคราะห์ว่าควรลงทุนในหุ้น A หรือไม่
อธิบายเหตุผลทีละขั้นตอน:
1. วิเคราะห์ผลประกอบการ
2. เปรียบเทียบกับคู่แข่ง
3. ประเมินความเสี่ยง
4. สรุปและให้คำแนะนำ"
4. ให้ตัวอย่าง (Few-Shot Learning)
"แปลประโยคต่อไปนี้เป็นภาษาอังกฤษแบบทางการ:
ตัวอย่าง:
- 'ขอบคุณครับ' → 'Thank you very much for your assistance.'
- 'ยินดีต้อนรับ' → 'We are pleased to welcome you.'
ประโยคที่ต้องการแปล:
- 'ขอโทษที่ตอบช้า'"
อ่านเพิ่มเติม วิธีสอน AI ให้เข้าใจธุรกิจของคุณ
อนาคตของ LLM
เทรนด์ที่น่าจับตา
- Multimodal ที่ดีขึ้น: เข้าใจภาพ, เสียง, วิดีโอ ได้ดีขึ้น
- Longer Context: จำได้มากขึ้น
- Agents: ทำงานอัตโนมัติได้ซับซ้อนขึ้น
- On-device AI: รันบนมือถือ/คอมพิวเตอร์ส่วนตัว
- Specialized LLMs: LLM เฉพาะทาง (การแพทย์, กฎหมาย, การเงิน)
อ่านเพิ่มเติม เทรนด์ AI ปี 2025
สรุป
ChatGPT ทำงานโดย:
- ทำนายคำถัดไป - เลือกคำที่น่าจะเกิดขึ้นมากที่สุด
- ใช้ Transformer - สถาปัตยกรรมที่เข้าใจความสัมพันธ์ในภาษา
- ฝึก 3 ขั้นตอน - Pre-training → SFT → RLHF
ข้อควรจำ:
- ✅ ChatGPT มีประโยชน์มากในการทำงานหลายอย่าง
- ⚠️ แต่ไม่ได้ "รู้" หรือ "เข้าใจ" อย่างแท้จริง
- ⚠️ อาจให้ข้อมูลผิด (Hallucination)
- ⚠️ ต้องตรวจสอบข้อมูลเสมอ
เข้าใจวิธีการทำงานของ ChatGPT จะช่วยให้ใช้งานได้อย่างมีประสิทธิภาพและรู้เท่าทัน!
พร้อมที่จะใช้ ChatGPT อย่างมืออาชีพแล้วหรือยัง?
สมัครเรียนคอร์สของเราได้ที่ AI Unlocked หรืออ่านบทความ Prompt Engineering Mastery เพื่อเรียนรู้เทคนิคขั้นสูง
เขียนโดย
AI Unlocked Team
บทความอื่นๆ ที่น่าสนใจ
วิธีติดตั้ง FFmpeg บน Windows และ Mac: คู่มือฉบับสมบูรณ์
เรียนรู้วิธีติดตั้ง FFmpeg บน Windows และ macOS พร้อมการตั้งค่า PATH อย่างละเอียด เพื่อใช้งานโปรแกรมตัดต่อวิดีโอและเสียงระดับมืออาชีพ
สร้าง AI-Powered SaaS: จากไอเดียสู่ผลิตภัณฑ์
คู่มือครบวงจรในการสร้าง AI-Powered SaaS ตั้งแต่การวางแผน พัฒนา ไปจนถึง launch และ scale รวมถึง tech stack, pricing และ business model
AI Security: วิธีใช้ AI อย่างปลอดภัย
เรียนรู้แนวทางการใช้ AI อย่างปลอดภัย ครอบคลุม prompt injection, data privacy, API security และ best practices สำหรับองค์กร