온톨로지와 메모리 시스템 (4/13) — AI 에이전트 메모리 시스템 설계: 23개 기능 구성

온톨로지와 메모리 시스템 (4/13) — AI 에이전트 메모리 시스템 설계: 23개 기능 구성

- 3월 31, 2026

AI 에이전트 메모리 시스템 설계 — 23개 기능 구성과 운영 가이드

네이티브 5개 + 커스텀 6개 + 스크립트 12개로 구축한 OpenClaw 메모리 아키텍처

핵심 요약

메모리 시스템을 네이티브(5) + 커스텀(6) + 자동화 스크립트(12) 총 23개 기능으로 구성했다
Reflect 파이프라인으로 API 토큰 96% 절감, Confidence Decay로 오래된 의견 자동 감쇠
운영 타임라인 순서(Reflect → Session Reset)를 지키지 않으면 데이터 손실이 발생한다

배경

AI 에이전트가 장기 운영되려면 메모리 관리가 핵심이다. 대화 내용을 무한정 쌓으면 토큰이 폭발하고, 무조건 지우면 맥락을 잃는다. OpenClaw 기반으로 구축한 메모리 시스템의 전체 구조를 정리한다.

본문

$커스텀 기능 6개$

네이티브 기능 5개 (openclaw.json 설정)

Memory Flush: 6,000 토큰 임계값에서 대화를 마크다운으로 저장
Compaction (safeguard 모드): 24,000 토큰 최소 예약으로 페르소나 보존
Session Reset/Maintenance: 매일 새벽 4시 리셋, 30일 후 자동 삭제
Context Pruning: 1시간 미사용 캐시 정리
Memory Search (Hybrid): 벡터 검색(0.7) + 텍스트 매칭(0.3)

커스텀 기능 6개

Retain 태그: W(지식), B(경험), O(의견+확신도), S(엔티티 상태) 분류
Bank 4-Tier 구조: Identity → Curated → Project → Episode 계층화
Reflect 파이프라인: 로컬 LLM 1차 처리 → 클라우드 최종 판단. 토큰 96% 절감(277k→5k)
Topic-Cued Recall: 0.1초 미만 실시간 키워드 기반 메모리 호출
Confidence Decay: 의견 확신도 일일 -0.02 자동 감쇠, 0.30 이하 삭제
Resolution Levels: 미활성 엔티티를 L2(전체) → L1(요약) → L0(제목만) 단계적 압축

시행착오 / 주의사항

자동화 스크립트 12개

retain-merge.py, memory-archive.sh, conflict-apply.py 등 12개 스크립트가 검증, 정리, 캐시 관리를 수행한다. 전부 Python/bash 기반이라 추가 비용은 0원이다.

시행착오 / 주의사항

운영 타임라인 순서가 치명적이다. 새벽 03:00에 Reflect 파이프라인이 실행된 후, 04:00에 Session Reset이 동작해야 한다. 이 순서가 뒤바뀌면 Reflect가 처리하기 전에 세션 데이터가 날아간다.

Confidence Decay처럼 시간 기반 수학적 감쇠는 LLM 판단보다 환각(hallucination) 오류가 없으므로 반드시 스크립트로 구현해야 한다.

마무리

메모리 시스템의 핵심은 "무엇을 기억할 것인가"보다 "무엇을 잊을 것인가"에 있다. 23개 기능은 많아 보이지만, 네이티브 설정 → 커스텀 로직 → 자동화 스크립트 순으로 계층화하면 관리 가능한 구조가 된다.

댓글