로컬 LLM 미들웨어로 로봇의 안전과 비용을 동시에 잡다
DM-LLM(Data Manager Local LLM) 아키텍처 - 클라우드 API의 비용과 환각 문제 해결
핵심 요약
- 클라우드 LLM에만 의존하면 토큰 비용 폭발, 환각에 의한 물리적 위험, 응답 지연이 동시에 발생한다
- DM-LLM(Data Manager Local LLM)을 하드웨어와 클라우드 사이의 지능형 미들웨어로 도입했다
- Safety Sandwich 패턴으로 명령 전후 이중 검증 체계를 구축했다
배경
OpenClaw v2026.1.30을 운영하면서 모든 판단을 클라우드 API(GPT-4, Claude 등)에만 의존하는 방식의 한계에 부딪혔다. 누적된 기억 데이터(MEMORY.md)를 매번 외부로 전송하면서 입력 토큰 비용이 기하급수적으로 증가했고, 간헐적 환각이 물리적으로 위험한 좌표 이동 명령으로 이어질 수 있는 상황이었다. 하드웨어와 클라우드 두뇌 사이에 새로운 지능형 계층이 필요했다.
본문
DM-LLM: 지능형 미들웨어
DM-LLM은 OpenClaw의 하드웨어 제어부(Runtime)와 외부 고지능 LLM(Cloud API) 사이에 위치하는 미들웨어다. Llama-3-8B나 Mistral-7B 같은 경량 로컬 모델을 온디바이스(On-device)로 실행해, 외부로 나가는 데이터를 전처리하고 들어오는 명령을 검증하는 수문장 역할을 한다.
효율성: 토큰 최적화
- 문맥 압축: MEMORY.md 전체를 외부에 보내지 않고, DM-LLM이 현재 상황에 필요한 정보만 요약해 '압축된 프롬프트'를 생성한다. API 호출 비용 70% 이상 절감 예상.
- 의미 기반 캐싱: "초기 위치로 이동해" 같은 반복 명령은 로컬 캐시에서 즉시 처리한다.
안전성: Safety Sandwich 패턴
로봇에게 환각은 물리적 충돌을 의미한다. 이중 검증 체계를 구축했다.
- Input Filter (명령 전): 사용자 명령이 안전한지 DM-LLM이 1차 판단
- Output Validator (명령 후): 외부 API가 생성한 JSON 좌표가 실제 작업 영역 내에 존재하는지 수학적 검증. 범위 밖 좌표는 즉시 폐기
제어: Lane Queue 동기화
OpenClaw의 Lane Queue 시스템과 연동해 한 번에 하나의 물리적 동작만 수행되도록 직렬화하고, 로봇이 EXECUTING 상태일 때 중복 명령이 외부 API로 전달되지 않도록 차단한다.
Brain vs. Spine 역할 분담
| 구분 | 담당 | 역할 |
|---|---|---|
| External API (Cloud) | Brain (전략) | 복잡한 추론, 창의적 문제 해결 |
| DM-LLM (Local) | Spine (전술) | 데이터 규격화, 실시간 제어, 검증 |
시행착오 / 주의사항
- 로컬 모델의 추론 품질이 기대에 못 미치면 Safety Sandwich의 Input Filter가 정상 명령까지 차단할 수 있다. 모델 선택이 중요하다.
- Lane Queue 없이 운영하면 동시 명령 충돌로 예측 불가능한 동작이 발생한다.
마무리
DM-LLM 도입은 OpenClaw를 단순 하드웨어에서 스스로 데이터를 관리하고 안전을 판단하는 에이전트로 진화시키는 과정이다. 비용 절감, 환각 방어, 반응 속도 향상을 동시에 달성하는 핵심은 "로컬에서 필터링하고 클라우드에서 사고하는" 역할 분리에 있다.
댓글
댓글 쓰기