맥미니 M4와 OpenClaw로 시작하는 개인 AI 에이전트

16GB를 버리고 32GB를 선택한 아키텍처적 판단과, 하이브리드 AI 비서 설계의 시작점

핵심 요약

OpenClaw를 접한 다음 날 맥미니 M4 구매를 결정했다 — 충동이 아니라 아키텍처적 판단
외부 API 중심도, 로컬 LLM 중심도 아닌 하이브리드 구조를 선택했다
로컬 LLM에게 "수문장(Gatekeeper)" 역할을 부여해 비용 절감, 보안 강화, 정확도 향상을 동시에 노렸다

배경

OpenClaw를 처음 접한 것은 2월 2일이었다. 정확히 하루 뒤인 2월 3일, 맥미니 M4 구매 버튼을 눌렀다.

2026년 현재, AI는 개인의 손안에서 직접 구동되고 실질적인 업무를 수행하는 단계에 도달했다. 나는 이 흐름을 뒤에서 정리하며 구경하는 사람이 되고 싶지 않았다. 직접 써보고 실패하고, 그 과정에서 최적의 구조를 고민하는 설계자의 자리에 서고 싶었다. 지금 시작하지 않으면 영원히 "사용자"로만 남게 될 것이라는 확신이 나를 움직였다.

본문

아키텍처 선택: 하이브리드 구조

하드웨어를 결정한 뒤 직면한 질문은 "무엇을 쓰느냐"가 아니라 "어떻게 아키텍처를 설계하느냐"였다.

외부 API 중심: 편리하지만 고비용, 보안 취약
로컬 LLM 중심: 보안 우수, 하드웨어 사양 제약

이 사이에서 하이브리드 구조라는 결론을 내렸다. 로컬 LLM에게 모든 것을 맡기기보다, 외부 API로 넘어가기 전 데이터를 정제하고 관리하는 "수문장(Gatekeeper)" 역할을 부여하기로 했다.

로컬 LLM의 역할 정의: 지능형 전처리기

설계한 로컬 LLM(Qwen 32B 등)의 역할은 복잡한 추론이 아니다. 외부 API의 부담을 줄이고 데이터 가치를 높이는 전처리에 집중한다.

비용 절감: 델타 요약(변경분만 추출)과 중복 제거로 외부 전송 토큰 최소화
보안 강화: PII(Personally Identifiable Information, 개인 식별 정보) 마스킹으로 민감 데이터 외부 유출 차단
정확도 향상: 태깅, 분류, 포맷 변환(JSON/YAML)으로 외부 API가 이해하기 쉬운 상태 제공
지식 관리: 중요도 스코어링으로 외부 API 호출 여부 판단 (Semantic Caching)

32GB를 선택한 이유

처음에는 기본형이면 충분하다고 생각했다. 하지만 Gatekeeper 아키텍처를 안정적으로 운영하려면 로컬 LLM이 상주할 메모리 여유가 필수적이었다. 기존 주문을 취소하고 맥미니 M4 32GB로 재결제했다. 로컬 LLM이 시스템의 중추 역할을 수행하기 위한 아키텍처적 판단이었다.

시행착오 / 주의사항

주문 변경으로 배송이 2~4주 늦어졌다. 예상치 못한 기다림이었지만 준비 기간으로 활용했다
완성된 결과물을 한 번에 보여주기보다, 왜 이런 결정을 했는지, 어느 지점에서 고민했고 무엇을 버렸는지를 기록하기로 했다

마무리

이 블로그의 탄생 자체가 첫 번째 기록이다. 앞으로 채워질 내용은 2026년형 개인 AI 비서를 구축해가는 과정 — 판단의 이유와 버린 것들의 기록이 될 것이다.

이 블로그 검색

MaJu's Note