OpenClaw 비용 관리와 실전 운영 노하우 — 3개월 운영 회고
역할 분리 기반 API 비용 최적화와 CLI 운영 팁 정리
핵심 요약
- 모든 작업을 3계층(Premium/Cheap/Free)으로 분류하고 모델을 매핑하면 비용을 구조적으로 통제할 수 있다
- Reflect 파이프라인의 판단/실행 분리와 Thinking 모드 비활성화로 토큰 소비를 1/4로 압축했다
- Fallback 설정이 "우상향"하지 않도록 반드시 성능·비용이 함께 낮아지는 구조로 설계해야 한다
배경
OpenClaw 기반 시스템을 구축하고 모든 에이전트에 Premium 모델을 연동했다. 일주일 만에 한 달치 API 예산을 초과했다. 로그를 분석해 보니 문제는 사용자 대화가 아니라, 30분마다 도는 Heartbeat와 새벽 Reflect 같은 백그라운드 자동화 작업이 최고가 모델의 토큰을 소비하고 있었다.
비용 최적화의 핵심은 모델 다운그레이드가 아니라 역할 배분과 실행 환경의 분리에 있었다.
본문
모델 비용 3계층(Tier) 아키텍처
| 계층 | 모델 예시 | 비용 (1M Input) | 적용 대상 |
|---|---|---|---|
| Premium | gpt-5.4, claude-sonnet-4.6 | $10+ | 사용자 대화, 복잡한 추론 |
| Cheap | gemini-flash-lite, haiku | $0.1~$1 | 단순 리서치, 가벼운 크론 |
| Free | ollama/qwen3.5:9b | 전기 요금 수준 | Heartbeat, Reflect Runner |
가장 드라마틱한 절감은 메인 에이전트(mir)의 설정 이원화에서 나왔다. 사용자 대화 시 gpt-5.4, Heartbeat 루프 시 로컬 qwen3.5:9b를 호출하도록 분기 처리했다. 하루 48회 발생하는 무의미한 API 과금을 원천 차단했다.
{
"mir": {
"model": { "primary": "openai-codex/gpt-5.4" },
"heartbeat": { "model": "ollama/qwen3.5:9b" }
}
}
Reflect 파이프라인의 구조적 비용 절감
매일 새벽 3시에 동작하는 Reflect는 가장 무거운 작업이다. 역할 역전(Role Inversion)을 통해 비용을 통제한다.
- Manager: gemini-2.5-flash가 요약된 메타데이터만 읽고 지시서 작성
- Runner: 로컬 qwen3.5:9b가 실제 파일 I/O를 최대 7번 반복 스폰하며 무료로 처리
Thinking 모드를 강제 종료(thinking: off)하여 토큰 소비를 1/4 수준으로 압축했다.
Fallback 전략과 로컬 LLM 경제학
API 장애 시 Fallback이 더 비싼 모델로 넘어가면 비용 폭탄이 된다.
- Bad:
gpt-5.4 → claude-opus-4(우상향) - Good:
gemini-3.1-pro → claude-sonnet-4.6 → ollama/qwen3.5:9b(안전망 구조)
로컬 모델 구동(Mac Mini M4 Pro) 시 추가 전기 요금은 월 5,000~8,000원 선이다. 응답 지연은 있지만 인간이 실시간으로 기다리지 않는 백그라운드 작업에는 완벽한 가성비를 제공한다.
시행착오 / 주의사항
3개월간 정립한 CLI 습관 5가지:
- 배포 전 무결성 검사:
openclaw doctor한 줄이 런타임 에러를 사전에 차단한다 - 설정 파일 문법 검증:
python3 -m json.tool Agent/.openclaw/openclaw.json으로 반드시 검증 - 워크스페이스 린팅:
bash scripts/agent-linter.sh로 에이전트 간 설정 불일치 점검 - 설정 변경 추적:
bash scripts/config-drift.sh로 정상 상태 스냅샷과 현재 설정 비교 - 크론 스케줄 분석:
bash scripts/cron-analytics.sh로 개별 크론 소요 시간과 실패 원인 추적
마무리
비용 최적화의 본질은 모델 단가표가 아니라 아키텍처의 역할 분리에 있다. 비싼 모델을 싼 모델로 단순 교체하는 건 미봉책이다. 반복 작업은 무료 로컬 모델로 내리고, 중요한 판단에만 Premium API를 태우는 구조적 격리만이 지속 가능한 유지비를 보장한다.
댓글
댓글 쓰기