ChatGPT ทำงานอย่างไร? เข้าใจ LLM แบบง่ายๆ

ChatGPT กลายเป็นปรากฏการณ์ที่เปลี่ยนโลก AI ไปตลอดกาล ตั้งแต่เปิดตัวในปี 2022 มีผู้ใช้งานมากกว่า 100 ล้านคนภายในเวลาเพียง 2 เดือน แต่หลายคนอาจยังสงสัยว่า ChatGPT ทำงานอย่างไร? บทความนี้จะอธิบายให้เข้าใจง่าย แม้ไม่มีพื้นฐานเทคนิค

ChatGPT คืออะไร?

ChatGPT (Chat Generative Pre-trained Transformer) เป็น AI Chatbot ที่พัฒนาโดย OpenAI มันเป็น Large Language Model (LLM) หรือโมเดลภาษาขนาดใหญ่ที่สามารถ:

สนทนาได้อย่างเป็นธรรมชาติ
ตอบคำถามได้หลากหลายหัวข้อ
เขียนเนื้อหา บทความ โค้ด
แปลภาษา สรุปข้อมูล
ช่วยคิดวิเคราะห์และแก้ปัญหา

หากต้องการความรู้พื้นฐานเกี่ยวกับ AI อ่าน AI คืออะไร? ความรู้พื้นฐานที่ทุกคนควรรู้

LLM (Large Language Model) คืออะไร?

Large Language Model คือโมเดล AI ที่:

ถูกฝึกด้วยข้อมูลข้อความมหาศาล (หลายล้านล้านคำ)
มี Parameters มหาศาล (GPT-4 มีประมาณ 1 ล้านล้าน parameters)
สามารถเข้าใจและสร้างภาษามนุษย์ได้

เปรียบเทียบ LLM ยอดนิยม

โมเดล	บริษัท	Parameters	จุดเด่น
GPT-4	OpenAI	~1.7 trillion	เก่งรอบด้าน, Multimodal
Claude 3	Anthropic	ไม่เปิดเผย	ปลอดภัย, เขียนดี
Gemini	Google	ไม่เปิดเผย	เชื่อมต่อ Google
Llama 3	Meta	70B / 405B	Open Source
Mistral	Mistral AI	7B-8x22B	เล็กแต่แรง

หลักการทำงานของ ChatGPT

1. ทำนายคำถัดไป (Next Token Prediction)

หัวใจของ ChatGPT คือการ ทำนายคำถัดไป ที่น่าจะเกิดขึ้น:

Input: "สวัสดี วันนี้อากาศ"
ChatGPT คิด: คำถัดไปที่น่าจะเป็น...
- "ดี" (40%)
- "ร้อน" (25%)
- "เย็น" (15%)
- "แจ่มใส" (10%)
- อื่นๆ (10%)

Output: "ดี" (เลือกคำที่มีโอกาสสูงสุด)

2. Token คืออะไร?

Token คือหน่วยย่อยของข้อความที่ LLM เข้าใจ:

ประโยค: "สวัสดีครับ ผมชื่อ AI"

Tokenization:
["สวัสดี", "ครับ", " ผม", "ชื่อ", " AI"]
= 5 tokens

ภาษาอังกฤษ:
"Hello, my name is AI"
["Hello", ",", " my", " name", " is", " AI"]
= 6 tokens

3. Context Window

Context Window คือจำนวน tokens ที่ LLM สามารถ "จำ" ได้ในการสนทนาครั้งหนึ่ง:

โมเดล	Context Window
GPT-3.5	4,096 tokens
GPT-4	8,192 - 128,000 tokens
Claude 3	200,000 tokens
Gemini 1.5	1,000,000 tokens

สถาปัตยกรรม Transformer

ChatGPT ใช้สถาปัตยกรรม Transformer ที่ Google นำเสนอในปี 2017:

ส่วนประกอบหลัก

┌─────────────────────────────────────────┐
│              Transformer                │
├─────────────────────────────────────────┤
│                                         │
│  ┌─────────────────────────────────┐   │
│  │         Output Layer            │   │
│  │    (สร้างคำตอบ/ข้อความ)         │   │
│  └─────────────────────────────────┘   │
│                  ↑                      │
│  ┌─────────────────────────────────┐   │
│  │      Transformer Layers         │   │
│  │   (หลายสิบ-หลายร้อยชั้น)         │   │
│  │   • Self-Attention              │   │
│  │   • Feed Forward Network        │   │
│  └─────────────────────────────────┘   │
│                  ↑                      │
│  ┌─────────────────────────────────┐   │
│  │         Embedding Layer         │   │
│  │    (แปลงคำเป็นตัวเลข)           │   │
│  └─────────────────────────────────┘   │
│                  ↑                      │
│  ┌─────────────────────────────────┐   │
│  │           Input                 │   │
│  │    (ข้อความที่ป้อนเข้า)          │   │
│  └─────────────────────────────────┘   │
│                                         │
└─────────────────────────────────────────┘

Self-Attention คืออะไร?

Self-Attention ทำให้ AI เข้าใจความสัมพันธ์ระหว่างคำในประโยค:

ประโยค: "แมวตัวนี้ชอบนอนบนโซฟา มันน่ารักมาก"

Self-Attention เข้าใจว่า:
- "มัน" หมายถึง "แมว" (ไม่ใช่ "โซฟา")
- "น่ารัก" เชื่อมโยงกับ "แมว"

เปรียบเทียบ:
"หมาตัวนี้ไล่แมว มันวิ่งหนี"
- "มัน" หมายถึง "แมว" (ถูกไล่จึงหนี) หรือ "หมา" (ไล่จึงวิ่ง)?
- AI ต้องเข้าใจบริบท

3 ขั้นตอนการฝึก ChatGPT

ขั้นที่ 1: Pre-training (การฝึกล่วงหน้า)

ข้อมูล: ข้อความจากอินเทอร์เน็ตมหาศาล (หนังสือ, เว็บไซต์, Wikipedia)
วิธีการ: ให้ทำนายคำถัดไปจากข้อความ
ผลลัพธ์: ได้ Base Model ที่เข้าใจภาษา

ฝึก: "ประเทศไทยมีเมืองหลวงคือ ____"
คำตอบ: "กรุงเทพมหานคร"

ทำซ้ำหลายล้านล้านครั้งกับข้อความต่างๆ

ขั้นที่ 2: Supervised Fine-Tuning (SFT)

ข้อมูล: ตัวอย่างการสนทนาที่มนุษย์เขียน
วิธีการ: ให้ AI เรียนรู้วิธีตอบคำถามแบบมนุษย์

ผู้ใช้: "วิธีทำผัดไทย?"
ผู้ช่วย: "นี่คือขั้นตอนการทำผัดไทย:
1. แช่เส้นในน้ำอุ่น 30 นาที
2. ผัดกุ้งกับกระเทียม
3. ใส่เส้นและปรุงรส..."

ขั้นที่ 3: RLHF (Reinforcement Learning from Human Feedback)

ข้อมูล: มนุษย์ให้คะแนนคำตอบของ AI
วิธีการ: ปรับ AI ให้ตอบแบบที่มนุษย์ชอบ

คำถาม: "อธิบาย Quantum Computing"

คำตอบ A: [อธิบายเทคนิคซับซ้อน]
คำตอบ B: [อธิบายด้วยตัวอย่างง่ายๆ]

มนุษย์ให้คะแนน: B > A
AI เรียนรู้: ควรอธิบายให้เข้าใจง่าย

GPT-4 กับความสามารถ Multimodal

GPT-4 และรุ่นใหม่ๆ เป็น Multimodal AI ที่เข้าใจได้หลายรูปแบบ:

รองรับหลายรูปแบบข้อมูล

ข้อความ (Text): อ่าน เขียน แปล สรุป
รูปภาพ (Image): วิเคราะห์ อธิบาย ตอบคำถามจากรูป
เสียง (Audio): GPT-4o รองรับการสนทนาด้วยเสียง

ตัวอย่างการใช้งาน Multimodal

ผู้ใช้: [อัปโหลดรูปเมนูร้านอาหาร]
       "แนะนำอาหารสำหรับคนแพ้ถั่ว"

ChatGPT: "จากเมนูนี้ อาหารที่ปลอดภัยสำหรับคนแพ้ถั่วคือ:
1. ผัดไทยกุ้ง (ไม่มีถั่ว)
2. ต้มยำกุ้ง
⚠️ หลีกเลี่ยง: ผัดถั่วลิสง, ก๋วยเตี๋ยวราดหน้า (มีถั่วลิสงบด)"

ChatGPT รู้ได้อย่างไร?

สิ่งที่ ChatGPT "รู้"

ChatGPT ไม่ได้ "รู้" หรือ "เข้าใจ" จริงๆ แต่:

Pattern Recognition: จดจำ patterns จากข้อมูลที่เรียนมา
Statistical Correlation: เข้าใจความสัมพันธ์ทางสถิติระหว่างคำ
Learned Associations: เชื่อมโยงแนวคิดจากการฝึก

ตัวอย่าง

ถาม: "ดวงอาทิตย์ขึ้นทางทิศไหน?"

ChatGPT ไม่ได้ "รู้" ว่าดวงอาทิตย์คืออะไร
แต่เห็นว่าในข้อมูลการฝึก:
- "ดวงอาทิตย์ขึ้นทางทิศตะวันออก" ปรากฏบ่อยมาก
- "ดวงอาทิตย์ขึ้นทางทิศตะวันตก" แทบไม่มี

จึงตอบว่า: "ทิศตะวันออก"

ข้อจำกัดของ ChatGPT

1. Hallucination (การสร้างข้อมูลเท็จ)

ChatGPT อาจ สร้างข้อมูลที่ดูน่าเชื่อแต่ไม่จริง:

ถาม: "บอกหนังสือ AI ของ John Smith ปี 2020"

ChatGPT อาจตอบ:
"หนังสือ 'AI Revolution' โดย John Smith ตีพิมพ์ปี 2020
ครอบคลุมเรื่อง Machine Learning และ Neural Networks..."

⚠️ ปัญหา: อาจไม่มีหนังสือนี้จริง!

2. Knowledge Cutoff (ความรู้มีวันหมดอายุ)

ChatGPT มี Knowledge Cutoff (วันที่ข้อมูลสิ้นสุด)
ไม่รู้เหตุการณ์หลังวันนั้น (ยกเว้นใช้ Browsing)

3. ไม่มี Common Sense แท้จริง

ถาม: "ถ้าใส่ช้างในตู้เย็น ต้องทำอย่างไร?"

ChatGPT อาจตอบอย่างจริงจัง:
"1. เปิดประตูตู้เย็น
2. ใส่ช้างเข้าไป
3. ปิดประตู"

⚠️ ไม่เข้าใจว่าเป็นเรื่องตลก/เป็นไปไม่ได้

4. ไม่มี Memory ระยะยาว

ChatGPT ไม่จำการสนทนาก่อนหน้า (ยกเว้น Custom Instructions)
แต่ละ session เริ่มใหม่

เปรียบเทียบ ChatGPT กับ AI อื่น

ฟีเจอร์	ChatGPT	Claude	Gemini
บริษัท	OpenAI	Anthropic	Google
จุดเด่น	เก่งรอบด้าน	ปลอดภัย, งานเขียน	เชื่อมต่อ Google
Multimodal	ใช่ (GPT-4)	ใช่ (Claude 3)	ใช่
Context	128K	200K	1M
ราคา	$20/เดือน	$20/เดือน	$20/เดือน

อ่านเพิ่มเติมเกี่ยวกับ 10 AI Tools ที่ธุรกิจควรใช้ในปี 2025

เทคนิคการใช้ ChatGPT อย่างมีประสิทธิภาพ

1. เขียน Prompt ที่ดี

❌ Prompt ที่ไม่ดี:
"เขียนบทความ"

✅ Prompt ที่ดี:
"เขียนบทความเกี่ยวกับ 'วิธีลดน้ำหนักอย่างยั่งยืน'
- ความยาว 800 คำ
- กลุ่มเป้าหมาย: คนวัย 30-40 ปี
- โทน: เป็นกันเอง ให้กำลังใจ
- มีตัวอย่างจริง
- มี 5 ขั้นตอนหลัก"

อ่านเพิ่มเติม Prompt Engineering Mastery

2. ใช้ System Message / Custom Instructions

System: "คุณเป็นที่ปรึกษาการเงินมืออาชีพ
ตอบคำถามด้วยภาษาที่เข้าใจง่าย
ให้ตัวอย่างเป็นตัวเลขเสมอ
เตือนเรื่องความเสี่ยงทุกครั้ง"

3. ขอให้คิดทีละขั้น (Chain of Thought)

"ช่วยวิเคราะห์ว่าควรลงทุนในหุ้น A หรือไม่
อธิบายเหตุผลทีละขั้นตอน:
1. วิเคราะห์ผลประกอบการ
2. เปรียบเทียบกับคู่แข่ง
3. ประเมินความเสี่ยง
4. สรุปและให้คำแนะนำ"

4. ให้ตัวอย่าง (Few-Shot Learning)

"แปลประโยคต่อไปนี้เป็นภาษาอังกฤษแบบทางการ:

ตัวอย่าง:
- 'ขอบคุณครับ' → 'Thank you very much for your assistance.'
- 'ยินดีต้อนรับ' → 'We are pleased to welcome you.'

ประโยคที่ต้องการแปล:
- 'ขอโทษที่ตอบช้า'"

อ่านเพิ่มเติม วิธีสอน AI ให้เข้าใจธุรกิจของคุณ