QuotaCheap Playbook

OpenClaw Compaction và Session Pruning: giữ agent nhớ đủ, nhẹ context, không mất lịch sử

Hướng dẫn OpenClaw Compaction và Session Pruning: auto compaction, /compact, memory flush, transcript successor, contextPruning cache ttl, tool result trim…

Compaction tóm tắt hội thoại cũ vào transcript. Pruning chỉ trim tool results trong memory trước mỗi LLM call. Hai cơ chế khác nhau, dùng cùng nhau để session dài vẫn chạy ổn và đỡ đốt token.

Playbook tiếng Việt về OpenClaw Compaction và Session Pruning: auto-compaction, manual /compact, memory flush, identifier preservation, successor transcripts, context pruning, tool-result trimming, cache TTL, session maintenance và QuotaCheap cost visibility.

AI agent production không chết vì thiếu “trí thông minh” trước.

Nó thường chết vì context phình, tool output dài như sớ, transcript nặng, model chạm context limit, rồi agent bắt đầu quên quyết định quan trọng.

OpenClaw xử lý phần này bằng hai cơ chế bổ trợ: Compaction : tóm tắt older conversation vào một compact entry lưu trong session transcript.

Session pruning : trim old tool results trong context trước mỗi LLM call, không sửa transcript trên disk.

Một cái là “nén ký ức hội thoại”.

Một cái là “dọn rác tool output trước khi gửi model”.

Nhầm hai cái này là mở đầu của nhiều bug rất có tâm linh.

Vì sao cần compaction?

Mỗi model có context window: số token tối đa model xử lý được.

Khi conversation gần limit, OpenClaw compacts older messages thành summary để chat tiếp tục.

Docs mô tả flow: 1.

Older conversation turns được summarized thành compact entry.

Summary được saved trong session transcript.

Recent messages được giữ intact.

OpenClaw giữ assistant tool calls paired với matching toolResult.

Nếu split point rơi vào giữa tool block, boundary được move để pair không bị cắt và current unsummarized tail vẫn được preserve.

Điểm quan trọng: full conversation history vẫn ở disk.

Compaction chỉ thay đổi những gì model thấy ở turn sau.

Auto compaction Auto compaction bật mặc định.

Nó chạy khi session gần context limit, hoặc khi model trả context overflow error.

Khi overflow xảy ra, OpenClaw compact rồi retry.

Bạn có thể thấy: embedded run auto compaction start / complete trong Gateway logs.

Auto compaction complete trong verbose mode.

/status hiển thị Compactions: <count .