하네스 엔지니어링 시리즈 (6편)

하네스 엔지니어링 시리즈 (6편)

컨텍스트·메모리·도구·라우팅·평가 — 에이전트를 둘러싼 모든 것


선수 지식AI 입문 시리즈 (권장)
다음 시리즈AI 코딩 에이전트 실전 시리즈 (5편)

전체 편 목록

1하네스 엔지니어링이란? (시리즈 1/6) — 같은 모델, 6배 성능 차이를 만드는 것
핵심 명제: Agent = Model + Harness. 같은 모델·다른 하네스로 같은 벤치마크에서 최대 6배 성능 차이가 난다. 모델은 더 이상 차별화 변수…
2Context Engineering — 모델에게 무엇을 보여줄 것인가 (하네스 시리즈 2/6)
시리즈 1/6에서 정의한 7가지 엔지니어링 문제 중 두 번째. 모델에게 무엇을 보여줄지 결정하는 일. 좋은 컨텍스트 → 좋은 답. 컨텍스트가 망가지면 GPT-…
3Memory Systems — 컨텍스트 밖에서 정보를 보존하는 법 (하네스 시리즈 3/6)
Part 2에서 컨텍스트 윈도우는 작게 쓰는 게 답이라고 했다. 그럼 옛 정보는 어디로 가는가? 답은 외부 메모리 시스템. 2026년 들어 메모리 자체가 별도…
4Tools & Sandboxing — 에이전트가 행동하는 영역 (하네스 시리즈 4/6)
모델은 추론한다. 하네스는 행동한다. 도구 호출이 잘못되면 에이전트가 사용자 시스템을 망가뜨릴 수 있다. 이 글은 그 행동 영역의 안전 설계를 다룬다.
5Multi-Provider Routing — 어느 모델에게 어떤 일을 보낼 것인가 (하네스 시리즈 5/6)
카테고리별 1위 모델은 시리즈 ①에서 봤다. 9개 다 쓰면 좋은데, 매번 어느 걸 쓸지 어떻게 결정하나? 답은 라우팅 레이어.
6Evaluation & Operations — 측정 가능해야 개선 가능하다 (하네스 시리즈 6/6)
시리즈를 종합하는 마지막 글. 컨텍스트(2)·메모리(3)·도구(4)·라우팅(5)을 다 잘 만들었는데, 작동 중인지 어떻게 아는가? 답은 측정. 측정 못하면 개…

권장 학습 페이스

편당 평균 25~40분 분량. 일주일에 1~3편 페이스로 진행하면 정착도가 가장 높다.

댓글

이 블로그의 인기 게시물

"LLM 핵심 학습 (1/6) — 기본: 토큰화·임베딩·어텐션·위치 인코딩"

"LLM 핵심 학습 (2/6) — 파인튜닝: LoRA·QLoRA·증류·Adapter"

"ML 기초 학습 (1/9) — 머신러닝과 sklearn: 학습의 좌표계"