Hermes AgentMemoryPersistent MemoryAI AgentAgentic AI

Hermes Agent Memory ทำงานยังไง — Persistent Memory ข้ามเซสชันแบบไม่ลืม

เจาะลึก Hermes Agent memory ระบบ Persistent Memory ที่จำงานข้ามเซสชันได้ ใช้ LLM summarization กับ FTS5 indexing ทำงานยังไง ต่างจากความจำ ChatGPT อย่างไร

AI Unlocked Team
08/06/2569
Hermes Agent Memory ทำงานยังไง — Persistent Memory ข้ามเซสชันแบบไม่ลืม

Hermes Agent Memory ทำงานยังไง — Persistent Memory ข้ามเซสชันแบบไม่ลืม

เคยรู้สึกหงุดสักแค่ไหน ตอนที่คุยกับ ChatGPT ทั้งวัน บอกบริบทงานไปเยอะมาก แล้วพอเปิด session ใหม่ มันก็ถามคำถามเดิมซ้ำอีกครั้ง ราวกับว่าไม่เคยคุยกันมาก่อน? นั่นคือจุดอ่อนของ chatbot ส่วนใหญ่ ความจำมันหายไปพร้อม session ที่ปิดไป — และนี่คือปัญหาหลักที่ Hermes Agent memory เกิดมาเพื่อแก้โดยตรง

Hermes Agent memory ถูกออกแบบมาเพื่อแก้ปัญหาข้อนี้โดยตรง ด้วยสถาปัตยกรรมที่ไม่เหมือน AI ตัวอื่น — มันไม่ได้แค่ "จำ" แบบ keyword ง่ายๆ แต่สร้างความเข้าใจสะสม เหมือนผู้ช่วยที่ยิ่งทำงานด้วยกันนาน ยิ่งรู้จักเราลึกขึ้น

ในบทความนี้เราจะเจาะลึก Hermes Agent memory architecture ตั้งแต่ระดับแนวคิดไปจนถึงเทคนิค LLM summarization และ FTS5 full-text indexing — แบบที่ไม่ต้องมีพื้นหลัง AI engineer ก็เข้าใจได้


สารบัญ

  1. ปัญหาของ Context Window — ทำไม AI ทั่วไปถึงจำไม่ได้
  2. Hermes Agent Memory คืออะไร — ภาพรวมระบบ
  3. Hermes Agent Memory ข้ามเซสชัน — Cross-Session ทำงานยังไง
  4. LLM Summarization — บีบอัดความทรงจำแบบฉลาด
  5. FTS5 Full-Text Indexing — ค้นหาความทรงจำไวเหมือน Google
  6. Skills System — ความจำระดับ Procedural
  7. Hermes Memory vs ChatGPT Memory — ต่างกันยังไง
  8. ความเป็นส่วนตัว — ข้อมูลอยู่ที่ไหน
  9. ตัวอย่างการใช้งานจริง — Memory ช่วยอะไรได้บ้าง
  10. ปรับแต่ง Memory ให้ทำงานได้ดีขึ้น — Context Files และ SOUL.md
  11. คำถามที่พบบ่อย
  12. สรุป

1. ปัญหาของ Context Window — ทำไม AI ทั่วไปถึงจำไม่ได้

ก่อนจะเข้าใจว่า Hermes Agent memory เจ๋งยังไง ต้องเข้าใจก่อนว่า AI chatbot ทั่วไปมีปัญหาอะไร

Context Window คืออะไร

ลองนึกภาพว่า AI เป็นคนที่อ่านได้ครั้งละหน้าเดียวของสมุดโน้ต ทุก session ใหม่ หน้านั้นโดนลบ แล้วเริ่มเขียนใหม่ตั้งแต่ต้น — นั่นคือ context window

โมเดลภาษาเช่น GPT-4 หรือ Claude ประมวลผลข้อมูลใน "หน้าต่าง" ขนาดจำกัด (วัดเป็น token) ทุกอย่างที่ AI รู้ได้ต้องอยู่ใน context window นี้ พอ session จบ window ว่างใหม่ ไม่มีอะไรเหลือ

Session 1:  [ข้อมูลเยอะมาก] → ปิด session → 🗑️ ลืมหมด
Session 2:  [ว่างเปล่า] → ต้องอธิบายทุกอย่างใหม่อีกครั้ง

ปัญหาในชีวิตจริง

สมมติคุณใช้ AI เป็นผู้ช่วยธุรกิจ:

  • วันจันทร์: บอกว่า "ร้านเราขายเสื้อผ้า กลุ่มลูกค้าอายุ 20-35 ปี สไตล์ minimalist"
  • วันอังคาร: เปิด session ใหม่ ต้องบอกซ้ำอีกครั้ง
  • วันพุธ: บอกซ้ำอีก

นี่คือการเสียเวลาที่ไม่ควรเกิด และถ้างานซับซ้อนขึ้น เช่น โปรเจกต์ที่มีหลายส่วน หลายคน หลายไฟล์ — ปัญหานี้ยิ่งเจ็บปวดกว่าเดิมมาก


2. Hermes Agent Memory คืออะไร — ภาพรวมระบบ

Hermes Agent มีระบบความจำ 3 ชั้น ทำงานร่วมกัน:

ชั้นความจำเปรียบเหมือนทำงานยังไง
Episodic Memoryบันทึกประจำวันจำเหตุการณ์/การสนทนา (raw logs)
Semantic Memoryสมุดโน้ตสรุปสรุปข้อมูลสำคัญผ่าน LLM
Procedural Memoryคู่มือทำงานไฟล์ SKILL.md — วิธีทำงานที่เรียนรู้มา

ระบบ 3 ชั้นนี้ไม่ได้แค่ "จำ" แต่มัน เข้าใจ บริบทของงานเรา เหมือนพนักงานที่ผ่านงานมาหลายเดือนกับเพิ่งเข้ามา — ความต่างคือประสบการณ์สะสม

ความจำแบบ Cross-Session

จุดที่ทำให้ Hermes ต่างจากชาวบ้านคือ ข้อมูลทุกอย่างถูกเขียนลง persistent storage (ฐานข้อมูล SQLite ในเครื่อง) ไม่ใช่ RAM ชั่วคราว พอ session ปิด ข้อมูลยังอยู่ พอเปิด session ใหม่ Hermes โหลด context ที่เกี่ยวข้องกลับมาอัตโนมัติ


3. Hermes Agent Memory ข้ามเซสชัน — Cross-Session ทำงานยังไง

นี่คือหัวใจของ Hermes Agent memory — ระบบที่ทำให้ agent "ไม่ลืม" ข้ามวัน ข้ามสัปดาห์

กระบวนการ Memory Cycle

ระหว่างสนทนา:
[ข้อความ] → บันทึก episodic log → SQLite DB

จบ session:
[episodic log] → LLM summarize → semantic memory update

เริ่ม session ใหม่:
[FTS5 query] → ดึง memory ที่เกี่ยวข้อง → ใส่ context อัตโนมัติ

ข้อมูลอะไรบ้างที่ Hermes จำ

Hermes ไม่ได้จำทุกอย่าง (มันจะหนักเกินไป) แต่ระบบเลือกจำสิ่งที่ มีนัยสำคัญ เช่น:

  • บริบทโปรเจกต์: ชื่อโปรเจกต์ เป้าหมาย technology stack ที่ใช้
  • ความชอบของผู้ใช้: สไตล์การตอบ รูปแบบ output ที่ชอบ
  • งานที่ทำค้างไว้: task ที่ยังไม่เสร็จ milestone ต่อไป
  • ข้อผิดพลาดที่เคยเจอ: ปัญหาที่เคยแก้ไปแล้ว ไม่ต้องแก้ซ้ำ
  • Skills ที่เรียนรู้: วิธีทำงานที่เคยสำเร็จมาแล้ว

Memory Retrieval — เรียกความจำอย่างฉลาด

สิ่งที่น่าทึ่งคือ Hermes ไม่ได้โหลด memory ทั้งหมดมาใส่ใน context ทุกครั้ง (จะทำให้ context ใหญ่เกินไปและช้า) แต่ใช้ semantic similarity เพื่อดึงเฉพาะความจำที่เกี่ยวข้องกับ task ปัจจุบัน

เหมือนคนที่มีสมุดโน้ตหลายเล่ม แต่รู้ว่าต้องเปิดเล่มไหน แทนที่จะต้องอ่านทุกเล่มตั้งแต่ต้น


4. LLM Summarization — บีบอัดความทรงจำแบบฉลาด

นี่คือส่วนที่ทำให้ Hermes Agent memory ฉลาดกว่า rule-based memory system ทั่วไป

ทำไมต้องใช้ LLM Summarize

การบันทึกบทสนทนาแบบ raw log ทุกอย่างมีข้อเสียชัดเจน:

  • ขนาดใหญ่: session 2 ชั่วโมงอาจมี token เป็นหมื่น
  • มีสิ่งไม่สำคัญเยอะ: "อ๋อ ได้เลย ขอบคุณนะ" ไม่ได้ให้ข้อมูลอะไร
  • ช้าในการค้น: ค้นหาในข้อมูลดิบเยอะๆ ใช้เวลานาน

LLM summarization แก้ปัญหาเหล่านี้ทั้งหมด

กระบวนการ Summarization

1. Raw log ของ session
   ↓
2. LLM อ่านและสกัดข้อมูลสำคัญ:
   - ตัดสิ่งไม่จำเป็นออก
   - เก็บ context หลัก
   - จับ pattern ที่เกิดซ้ำ
   ↓
3. สร้าง structured summary เก็บลง semantic memory
   ↓
4. ผนวกกับ existing memory (ไม่ทับของเดิม แต่ merge)

ตัวอย่างให้เห็นภาพ

สมมติคุณใช้ Hermes ช่วยเขียนโค้ด Python ทั้ง session:

Raw log (ยาวมาก):

"ช่วยเขียน function สำหรับ..." "โอเค ได้เลย..." "ขอบคุณ แก้นิดนึงได้ไหม..." "แน่นอน..." "เยี่ยมเลย ช่วยเพิ่ม error handling ด้วย..." ...

LLM Summary (กระชับ):

ผู้ใช้ทำงาน Python project เกี่ยวกับ data processing ชอบ code style ที่มี type hints และ error handling ครบ ใช้ library: pandas, requests ต้องการ output เป็น JSON format

จาก session ถัดไป Hermes รู้เลยโดยไม่ต้องถาม ว่าผู้ใช้ชอบ Python แบบไหน ใช้อะไร และงานอยู่ตรงไหน

Memory Compression Levels

ระบบ summarization มีการจัดการระดับ memory หลายชั้น:

  • Short-term: บันทึก session ปัจจุบันแบบละเอียด
  • Medium-term: สรุปรายสัปดาห์/ราย session
  • Long-term: สาระสำคัญระยะยาว — บุคลิก ความชอบ workflow ของผู้ใช้

5. FTS5 Full-Text Indexing — ค้นหาความทรงจำไวเหมือน Google

ครึ่งหลังของ Hermes Agent memory engine คือ FTS5 (Full-Text Search version 5) ซึ่งเป็น extension ของ SQLite ที่สร้างมาสำหรับค้นข้อความได้เร็วมาก

FTS5 คืออะไร

ถ้า semantic memory คือห้องสมุดที่เก็บหนังสือ FTS5 ก็คือระบบดัชนีที่ทำให้หาหนังสือได้ใน milliseconds แทนที่จะต้องเดินหาทีละชั้น

SQLite FTS5 เหมาะมากสำหรับ use case นี้เพราะ:

  • รันใน process เดียวกัน ไม่ต้องตั้ง database server แยก
  • ไฟล์เดียว พกพาง่าย backup ง่าย
  • ค้นเร็วมาก แม้ข้อมูลจะเยอะ
  • ไม่มี dependency ไม่ต้องลง Elasticsearch หรือ Postgres

การ Indexing ทำงานยังไง

เมื่อ LLM summarize memory แล้ว FTS5 จะสร้าง inverted index จากทุก token ในข้อความ:

Memory: "โปรเจกต์ e-commerce ใช้ React และ Node.js ลูกค้าเป็น SME"

FTS5 Index:
โปรเจกต์ → [memory_id: 42]
e-commerce → [memory_id: 42, memory_id: 87]
React      → [memory_id: 42, memory_id: 156]
Node.js    → [memory_id: 42]
SME        → [memory_id: 42, memory_id: 91]

Query ค้นหา Memory

เมื่อ session ใหม่เริ่ม Hermes ทำ FTS5 query จาก task ที่ผู้ใช้ให้:

SELECT * FROM memories
WHERE memories MATCH 'e-commerce React'
ORDER BY rank
LIMIT 10

ผลลัพธ์: memory ที่เกี่ยวข้องมากที่สุดถูกดึงมาใส่ context อัตโนมัติ — ทั้งหมดนี้เกิดในเสี้ยววินาที ก่อนที่ Hermes จะตอบคำถามแรก

Hybrid Search: FTS5 + Semantic

ระบบจริงไม่ได้ใช้ FTS5 อย่างเดียว แต่ผสม semantic similarity (vector-based) เพื่อครอบ edge case ที่ keyword ไม่ match แต่ความหมายเกี่ยวกัน:

ผู้ใช้ถาม "ช่วยเรื่องร้านค้าออนไลน์" → FTS5 อาจไม่ match "e-commerce" ตรงๆ แต่ semantic search จับได้ว่าความหมายเหมือนกัน


6. Skills System — ความจำระดับ Procedural

นอกจาก memory ที่จำ "อะไร" และ "เมื่อไหร่" Hermes ยังมีระบบที่จำ "ทำยังไง" ด้วย — นั่นคือ Skills System

SKILL.md คืออะไร

เมื่อ Hermes แก้ปัญหาหรือทำงานรูปแบบเดิมสำเร็จราว 3-4 ครั้ง ระบบจะอัตโนมัติ:

  1. สรุปขั้นตอนที่ใช้ได้ผล
  2. เขียนลงไฟล์ SKILL.md ในโปรเจกต์
  3. ครั้งต่อไปที่เจอโจทย์คล้ายกัน โหลด skill นี้มาใช้ก่อนเลย
# SKILL: Deploy Next.js to VPS

## When to use:
When user asks to deploy a Next.js app to a Linux server

## Steps:
1. Build: npm run build
2. Transfer: rsync -avz .next/ user@server:/app/
3. Restart: pm2 restart app
4. Verify: curl https://domain.com/health

## Notes:
- ผู้ใช้นี้ใช้ PM2 เป็น process manager
- Server อยู่ที่ ip xxx ต้องใช้ SSH key

ต่างจาก OpenClaw Skills ยังไง

Hermes SkillsOpenClaw Skills
สร้างโดยAgent เรียนรู้เองจากงานจริงเขียนด้วยมือ (static)
พัฒนาต่อได้ไหมใช่ ปรับปรุงอัตโนมัติตามประสบการณ์ต้องแก้เองด้วยมือ
เหมาะกับงานส่วนตัว เรียนรู้ workflow เฉพาะตัวเรามาตรฐาน team ที่กำหนดไว้ล่วงหน้า

Skills ของ Hermes เปรียบเหมือนน้องที่ฝึกงานมาสักพัก — เริ่มจากดูเราทำ แล้วค่อยๆ จำ pattern เองจนไม่ต้องสอนซ้ำ


7. Hermes Memory vs ChatGPT Memory — ต่างกันยังไง

หลายคนอาจนึกว่า "ChatGPT ก็มี Memory นี่?" จริงครับ แต่ต่างกันมาก

เปรียบเทียบโดยตรง

ฟีเจอร์Hermes AgentChatGPT Memory
เก็บข้อมูลที่ไหนเครื่องเรา (local)Server ของ OpenAI
ควบคุมได้ไหมควบคุมเต็มที่ เห็นไฟล์จริงดูได้ในจำกัด ลบได้บางส่วน
Telemetry/Trackingไม่มีข้อมูลผ่าน OpenAI server
Memory ละเอียดแค่ไหนEpisodic + Semantic + Proceduralส่วนใหญ่เป็น Semantic สรุปๆ
Skills/Proceduralมี (SKILL.md)ไม่มี
Cross-project memoryแยกตาม context file ได้รวมกันทั้งหมด
ค้น memory ได้ไหมได้ ผ่าน FTS5 + semantic searchระบบเลือกเอง ผู้ใช้ไม่ได้ control
ราคาฟรี (self-host)ต้องสมัคร ChatGPT Plus

ตัวอย่างที่เห็นความต่างชัด

ChatGPT Memory:

  • จำว่า "ผู้ใช้ทำงาน developer ชอบ Python"
  • แต่ไม่จำว่าโปรเจกต์ปัจจุบันอยู่ตรงไหน หรือเคยแก้ bug อะไรไปแล้ว

Hermes Memory:

  • จำ context โปรเจกต์ทั้งหมด
  • จำ dependency ที่ติดตั้งไว้
  • จำ error ที่เคยเกิดและวิธีแก้
  • จำ coding style ที่ชอบ
  • มี SKILL.md บอกว่า "deploy แบบไหนได้ผลกับ server ของผู้ใช้"

8. ความเป็นส่วนตัว — ข้อมูลอยู่ที่ไหน

ประเด็นนี้สำคัญมากสำหรับ Hermes Agent memory โดยเฉพาะถ้าคุณใช้กับงานที่มีข้อมูลส่วนตัวหรือธุรกิจ

ข้อมูลอยู่ในเครื่องเราเท่านั้น

เครื่องเรา
├── hermes/
│   ├── memory.db          ← SQLite + FTS5 index (เก็บ memory ทั้งหมด)
│   ├── skills/
│   │   └── *.skill.md     ← Procedural memory
│   └── contexts/
│       └── *.context.md   ← Project-specific context

ไม่มีการส่งข้อมูล memory ไปไหน ไม่มี telemetry ไม่มี analytics ไม่มี phone home ไม่มีบริษัทไหนเห็นว่าคุณจำอะไรไว้

แตกต่างจาก Cloud-based Memory โดยสิ้นเชิง

บริการอย่าง ChatGPT Plus, Gemini Advanced ที่มี memory ต้องส่งข้อมูลขึ้น server บริษัทเหล่านั้นก่อน แม้จะมี privacy policy ดีแค่ไหน แต่ข้อมูลก็ไม่ได้อยู่ที่เราแน่ๆ

สำหรับธุรกิจที่มี data compliance requirement หรือคนที่ทำงานกับข้อมูลละเอียดอ่อน ประเด็นนี้ไม่ใช่เรื่องเล็กน้อย

การ Backup Memory

เพราะ memory เก็บเป็น SQLite ไฟล์ธรรมดา การ backup ทำได้ง่ายมาก:

# backup memory ด้วยคำสั่งเดียว
cp ~/hermes/memory.db ~/backups/hermes-memory-$(date +%Y%m%d).db

ย้ายเครื่องก็ copy ไฟล์ไป — memory ตามมาด้วย


9. ตัวอย่างการใช้งานจริง — Memory ช่วยอะไรได้บ้าง

Use Case 1: นักพัฒนา Software

สัปดาห์ที่ 1: อธิบาย stack ของโปรเจกต์ให้ Hermes ฟัง สัปดาห์ที่ 4: Hermes รู้แล้วว่าโปรเจกต์ใช้ Next.js + Supabase + TypeScript, deploy บน Vercel, test ด้วย Playwright, code style ชอบแบบ functional มี type หมด

ผลลัพธ์: ไม่ต้องบอก context ซ้ำ ถามได้เลยว่า "ช่วย implement auth flow" แล้ว Hermes รู้เองว่าต้องใช้อะไร

Use Case 2: นักการตลาด Content Creator

Hermes จำว่า:

  • แบรนด์เสียงที่ใช้ (สนุก เป็นกันเอง ใช้คำว่า "เพื่อน")
  • กลุ่มเป้าหมาย (คนทำงาน 25-35 ปี ชอบ productivity)
  • content pillar ที่เน้น (tips, case study, behind the scenes)
  • hashtag ที่ใช้ประจำ

ผลลัพธ์: เขียน content ทีได้เลย ไม่ต้อง brief ซ้ำทุกครั้ง

Use Case 3: เจ้าของธุรกิจ SME

Hermes เป็นผู้ช่วยที่รู้จักธุรกิจเราทุกมุม:

  • สินค้า ราคา margin
  • ลูกค้า segment และปัญหาที่มักเจอ
  • supplier และเงื่อนไข
  • flow การทำงาน ทีม ขั้นตอน

เมื่อเจอปัญหาใหม่ Hermes ไม่ต้องถามพื้นฐานซ้ำ เริ่มให้คำปรึกษาได้เลยในบริบทที่ถูกต้อง

Use Case 4: นักเรียน/วิจัย

  • จำ bibliography ที่อ่านมาแล้ว
  • จำ argument ที่เคย develop ไว้
  • จำ gaps ที่ยังต้องหาคำตอบ
  • ต่อ session ได้โดยไม่ต้อง recap ทุกครั้ง

10. ปรับแต่ง Memory ให้ทำงานได้ดีขึ้น — Context Files และ SOUL.md

นอกจากระบบ memory อัตโนมัติแล้ว Hermes ยังมีเครื่องมือให้ผู้ใช้ "เขียนคู่มือตัวเอง" เพื่อให้ agent เข้าใจเราได้เร็วขึ้นตั้งแต่ต้น

Context Files — บริบทเฉพาะโปรเจกต์

Context file คือไฟล์ markdown ที่เราเขียนเองเพื่อบอก Hermes ว่าโปรเจกต์นี้คืออะไร มี stack อะไร มีข้อจำกัดอะไร ก่อนที่ memory ระยะยาวจะสะสมเพียงพอ

ตัวอย่าง context file สำหรับโปรเจกต์เว็บ:

# โปรเจกต์: ร้านค้าออนไลน์ XYZ

## Stack
- Frontend: Next.js 14, TypeScript, Tailwind CSS
- Backend: Supabase (PostgreSQL + Auth)
- Hosting: Vercel

## สิ่งที่ต้องระวัง
- ไม่ใช้ any type ใน TypeScript
- ทุก component ต้องมี error boundary
- Database query ต้องผ่าน RLS เสมอ

## ผู้ใช้ชอบ
- Code แบบ functional, ไม่ใช้ class
- มี JSDoc comment ทุก function สำคัญ
- Test ด้วย Playwright

Hermes โหลด context file นี้ทุก session โดยอัตโนมัติ ทำให้ตั้งแต่ครั้งแรกก็ไม่ต้องอธิบายพื้นฐานซ้ำ

SOUL.md — ปรับบุคลิกของ Agent

หนึ่งในฟีเจอร์ที่คนมักมองข้ามคือ SOUL.md ไฟล์นี้ให้เราปรับ "ตัวตน" ของ Hermes ได้ เช่น น้ำเสียงการตอบ ระดับความเป็นทางการ วิธีถามกลับเมื่อไม่ชัดเจน

# SOUL: น้อง Dev ผู้ช่วย

## บุคลิก
- พูดไทยเป็นหลัก ใช้ศัพท์เทคนิคภาษาอังกฤษตามปกติ
- ตรงประเด็น ไม่วนเวียน
- ถ้าไม่ชัด ถามก่อน 1 ข้อ อย่าเดาเอาเอง

## สิ่งที่ไม่ทำ
- ไม่ขึ้นต้นทุกประโยคว่า "แน่นอน!" หรือ "ยอดเยี่ยม!"
- ไม่ให้คำตอบยาวเกินความจำเป็น

SOUL.md + Context files + Memory ที่สะสมมา = ผู้ช่วยที่รู้จักเราและทำงานในแบบที่เราต้องการได้จริงๆ

Memory ที่โตขึ้นตาม Skills

เมื่อเวลาผ่านไป Hermes agent ไม่ได้แค่จำ — มันเรียนรู้และพัฒนา workflow ของตัวเองตาม pattern งานที่เราทำบ่อย ระบบ Skills จะเก็บขั้นตอนที่ทำซ้ำๆ แล้วสร้างเป็น shortcut อัตโนมัติ

เปรียบเหมือนพนักงานที่ทำงานด้วยกันมาครึ่งปี เขาไม่ต้องถามว่า "format report แบบไหน?" อีกต่อไป เพราะรู้แล้ว — Hermes ทำได้แบบเดียวกันนั้น

อ่านเพิ่มเติมเรื่อง Skills System ได้ที่ Hermes Skills System ทำงานยังไง


11. คำถามที่พบบ่อย (FAQ)

Hermes Agent memory ใช้พื้นที่เยอะไหม?

ไม่มาก เพราะ LLM summarization บีบอัดข้อมูลได้ดีมาก session ยาวๆ หลายชั่วโมงหลัง summarize อาจเหลือแค่ไม่กี่ KB โดยปกติ memory database ทั้งหมดหลายเดือนมักไม่เกินหลัก MB

ถ้า memory เสียหายหรืออยากรีเซ็ต ทำได้ไหม?

ได้ง่ายมาก เพราะ memory เก็บเป็นไฟล์ธรรมดาในเครื่อง ลบไฟล์ SQLite ออกก็รีเซ็ตได้ทันที หรือจะ backup ก่อนแล้วค่อยลบก็ได้

Hermes จำข้อมูลส่วนตัวที่ไม่อยากให้จำได้ไหม?

Hermes ออกแบบมาให้ผู้ใช้ควบคุม memory เองได้เต็มที่ สามารถดู ลบ หรือแก้ไข memory ที่เก็บไว้ได้โดยตรง ไม่มีระบบ black box ซ่อนอยู่

Memory ของ Hermes ทำงานได้กับโมเดล LLM อะไรบ้าง?

ระบบ memory ทำงานร่วมกับทุก LLM endpoint ที่ Hermes รองรับ ได้แก่ OpenRouter, OpenAI และ Nous Portal เพราะ memory เป็น layer แยกต่างหากจากโมเดลที่ใช้ตอบ

Hermes จำสิ่งที่คุยกันข้ามโปรเจกต์ได้ไหม?

ระบบแยก context ตามโปรเจกต์ได้ผ่าน Context files แต่ user-level preference (ความชอบส่วนตัว สไตล์การสื่อสาร) สามารถ share ข้ามโปรเจกต์ได้ ขึ้นอยู่กับการตั้งค่า

Hermes Memory vs RAG ต่างกันยังไง?

RAG (Retrieval-Augmented Generation) เป็นเทคนิคดึงเอกสารจาก knowledge base มาใส่ context ขณะที่ Hermes memory เน้นจำ บริบทของผู้ใช้และงาน โดยเฉพาะ ในทางปฏิบัติสามารถใช้ทั้งสองอย่างร่วมกันได้ — ใช้ RAG สำหรับ knowledge base เอกสาร และ Hermes memory สำหรับ context งานส่วนตัว อ่านเพิ่มเติมเรื่อง RAG ได้ที่ AI Agent กับ RAG Knowledge Base


12. สรุป

Hermes Agent memory ไม่ใช่แค่ฟีเจอร์เสริม — มันคือสิ่งที่ทำให้ Hermes เป็น "ผู้ช่วยที่แท้จริง" แทนที่จะเป็นแค่ chatbot ฉลาดๆ ที่ลืมเราทุกครั้งที่ปิดหน้าต่าง

สิ่งที่ทำให้ระบบ memory ของ Hermes โดดเด่น:

  • Cross-session persistence — ไม่ลืมข้ามวัน ข้ามสัปดาห์ ข้ามเดือน
  • LLM summarization — บีบอัดความจำแบบฉลาด เก็บสิ่งสำคัญ ตัดสิ่งไม่จำเป็น
  • FTS5 indexing — ค้น memory เร็วใน milliseconds
  • Skills system — เรียนรู้วิธีทำงานของเราและพัฒนาเองได้
  • Local storage — ข้อมูลทั้งหมดอยู่ในเครื่องเรา ไม่มี tracking ไม่มี lock-in

ยิ่งใช้ Hermes นาน ยิ่งฉลาดขึ้น ยิ่งรู้จักเรามากขึ้น — นั่นคือสิ่งที่ทำให้มันต่างจาก AI ทั่วไปที่เราต้องเริ่มอธิบายตัวเองใหม่ทุกครั้ง

ถ้าคุณสนใจ Hermes Agent และอยากเรียนรู้วิธีใช้งานแบบเต็มรูปแบบ ทีม AI Unlocked รวบรวมคอร์สและเนื้อหาเกี่ยวกับ AI agent ที่ใช้งานได้จริงสำหรับคนไทยไว้แล้ว

ดูคอร์สและราคา →


อ่านต่อ:

เขียนโดย

AI Unlocked Team

บทความอื่นๆ ที่น่าสนใจ