로컬 LLM 미들웨어로 로봇의 안전과 비용을 동시에 잡다

- 3월 31, 2026

DM-LLM(Data Manager Local LLM) 아키텍처 - 클라우드 API의 비용과 환각 문제 해결

핵심 요약

클라우드 LLM에만 의존하면 토큰 비용 폭발, 환각에 의한 물리적 위험, 응답 지연이 동시에 발생한다
DM-LLM(Data Manager Local LLM)을 하드웨어와 클라우드 사이의 지능형 미들웨어로 도입했다
Safety Sandwich 패턴으로 명령 전후 이중 검증 체계를 구축했다

$배경$

배경

OpenClaw v2026.1.30을 운영하면서 모든 판단을 클라우드 API(GPT-4, Claude 등)에만 의존하는 방식의 한계에 부딪혔다. 누적된 기억 데이터(MEMORY.md)를 매번 외부로 전송하면서 입력 토큰 비용이 기하급수적으로 증가했고, 간헐적 환각이 물리적으로 위험한 좌표 이동 명령으로 이어질 수 있는 상황이었다. 하드웨어와 클라우드 두뇌 사이에 새로운 지능형 계층이 필요했다.

본문

DM-LLM: 지능형 미들웨어

DM-LLM은 OpenClaw의 하드웨어 제어부(Runtime)와 외부 고지능 LLM(Cloud API) 사이에 위치하는 미들웨어다. Llama-3-8B나 Mistral-7B 같은 경량 로컬 모델을 온디바이스(On-device)로 실행해, 외부로 나가는 데이터를 전처리하고 들어오는 명령을 검증하는 수문장 역할을 한다.

효율성: 토큰 최적화

문맥 압축: MEMORY.md 전체를 외부에 보내지 않고, DM-LLM이 현재 상황에 필요한 정보만 요약해 '압축된 프롬프트'를 생성한다. API 호출 비용 70% 이상 절감 예상.
의미 기반 캐싱: "초기 위치로 이동해" 같은 반복 명령은 로컬 캐시에서 즉시 처리한다.

안전성: Safety Sandwich 패턴

로봇에게 환각은 물리적 충돌을 의미한다. 이중 검증 체계를 구축했다.

Input Filter (명령 전): 사용자 명령이 안전한지 DM-LLM이 1차 판단
Output Validator (명령 후): 외부 API가 생성한 JSON 좌표가 실제 작업 영역 내에 존재하는지 수학적 검증. 범위 밖 좌표는 즉시 폐기

제어: Lane Queue 동기화

OpenClaw의 Lane Queue 시스템과 연동해 한 번에 하나의 물리적 동작만 수행되도록 직렬화하고, 로봇이 EXECUTING 상태일 때 중복 명령이 외부 API로 전달되지 않도록 차단한다.

Brain vs. Spine 역할 분담

구분	담당	역할
External API (Cloud)	Brain (전략)	복잡한 추론, 창의적 문제 해결
DM-LLM (Local)	Spine (전술)	데이터 규격화, 실시간 제어, 검증

시행착오 / 주의사항

로컬 모델의 추론 품질이 기대에 못 미치면 Safety Sandwich의 Input Filter가 정상 명령까지 차단할 수 있다. 모델 선택이 중요하다.
Lane Queue 없이 운영하면 동시 명령 충돌로 예측 불가능한 동작이 발생한다.

마무리

DM-LLM 도입은 OpenClaw를 단순 하드웨어에서 스스로 데이터를 관리하고 안전을 판단하는 에이전트로 진화시키는 과정이다. 비용 절감, 환각 방어, 반응 속도 향상을 동시에 달성하는 핵심은 "로컬에서 필터링하고 클라우드에서 사고하는" 역할 분리에 있다.

이 블로그 검색

MaJu's Note