OpenClaw 구축·운영 (2/26) — OpenClaw 구축: 설치부터 로컬 모델 최적화까지

OpenClaw 기반 AI 에이전트 구축 - 설치부터 로컬 모델 최적화까지

Brain & Muscles 이원화 설계와 Mac Mini M4 로컬 추론 환경 구성


핵심 요약

  • 윈도우에서 OpenClaw 설치 시 Node.js v22(LTS)와 Visual Studio Build Tools가 필수다
  • 모델을 Brain(고추론)과 Muscles(단순 작업)로 분리해 비용 효율을 높이는 설계가 핵심이다
  • Mac Mini M4(32GB)에서 Qwen3-14B를 로컬 추론 서버로 활용할 수 있다

배경

AI 에이전트 시스템을 구축하면서 가장 고민했던 건 "모든 작업에 최고 사양 모델을 쓸 수 없다"는 현실적 제약이었다. 컴퓨팅 자원과 비용의 적재적소 배치가 핵심이고, 그 과정에서 얻은 설치 트러블슈팅부터 아키텍처 설계까지를 정리한다.

초기 환경 구축

본문

초기 환경 구축

윈도우 환경에서 대부분의 오류는 Node.js 버전 호환성과 네이티브 모듈 빌드 환경 부재에서 발생한다.

설치 체크리스트: 1. Python 3.10+ (Add Python to PATH 필수) 2. Visual Studio Build Tools (C++ 데스크톱 개발 워크로드) 3. Node.js v22(LTS) — v24(Current)는 호환성 문제가 잦다 4. npm install -g openclaw@latest 전에 기존 실패한 node_modules 강제 삭제

Brain & Muscles 이원화 설계

등급 역할 추천 모델
Premium 복잡한 의사결정, 아키텍처 설계 Claude 4.5, GPT-5
Balanced 웹 검색, 일반적인 코딩 Gemini 3 Flash, Kimi 2.5
Cheap 하트비트 체크, 단순 요약 GPT-5 Nano, 로컬 Qwen 3

AgentLinter: 설정 파일 무결성 검증

자연어 기반 설정은 침묵의 실패(Silent Failure)를 유발하기 쉽다. 린터를 도입해 "친절하게 대답해" 같은 모호한 지시를 "응답은 3문장 이내, 평어체로"로 구체화하도록 강제하고, API 키 노출과 지시 사항 간 모순을 사전에 감지한다.

로컬 모델: Mac Mini M4 활용

32GB 통합 메모리에서 OS/OpenClaw이 약 6~8GB를 점유하면 나머지 24~25GB가 가용하다. Qwen3-14B는 4비트 양자화(Q4_K_M) 시 약 9GB를 점유하므로, 나머지를 컨텍스트 윈도우 확장에 활용할 수 있다.

ollama run bazobehram/qwen3-14b-claude-4.5-opus-high-reasoning

시행착오 / 주의사항

  • 에이전트에 시스템 권한을 부여할 때는 Tailscale 같은 VPN으로 네트워크를 격리하고 공용 SSH 포트(22)를 차단해야 한다
  • 프롬프트 인젝션 방어를 위한 시스템 가드레일 설정이 필수다
  • 40k 토큰 임계값에서 세션을 요약 저장하는 compaction 설정으로 토큰 비용 폭발을 방지한다

마무리

AI 에이전트 구축은 단순 설치가 아니라 컴퓨팅 자원과 비용 효율의 최적화 과정이다. Brain과 Muscles를 분리하고, 로컬 모델로 단순 작업을 처리하며, 보안 규칙을 준수할 때 신뢰할 수 있는 자율 에이전트가 완성된다.

댓글