평가·운영·메모리 시리즈 (4편)

평가·운영·메모리 시리즈 (4편)

평가, handoff, 권한, 메모리 소유권으로 장시간 에이전트 운영을 안정화하는 법

시리즈 전체 안내


선수 지식하네스 엔지니어링 기초 시리즈 (권장)
다음 시리즈패턴·전략·사례 시리즈 (4편)

전체 편 목록

1에이전트 평가 하네스 (1/4) — AI 결과를 테스트·루브릭·회귀 평가로 검증하는 법
AI 에이전트의 가장 흔한 착시는 "몇 번 잘 됐다"를 "이제 된다"로 착각하는 것이다. 평가 하네스는 이 착시를 깨는 구조다. 한 번 잘 나온 결과가 아니라…
2장시간 에이전트 운영 (2/4) — 컨텍스트가 끊겨도 일하게 만드는 handoff 설계
장시간 에이전트 운영을 메모리 문제로만 보면 설계를 그르치기 쉽다. 실제로 먼저 필요한 것은 "무엇을 기억할까"보다 "어디서 멈췄고, 다음 세션이 무엇부터 이…
3AI 운영 안전장치 (3/4) — 권한 관리, 승인 루프, 샌드박스, 감사 로그 설계
AI 운영 안전장치는 "모델이 실수할 수 있다"는 전제에서 출발한다. 좋은 운영은 모델을 무조건 믿지 않는다. 대신 어디까지 허용할지, 어디서 사람 승인을 받…
4메모리 소유권 (4/4) — AI 에이전트 메모리를 직접 소유해야 하는 이유
에이전트의 메모리는 부가기능이 아니다. 무엇을 기억하고, 어디에 저장하고, 언제 잊고, 누가 읽고, 다른 시스템으로 옮길 수 있는지가 곧 운영권이다. 기억을…

권장 학습 페이스

편당 평균 25~40분 분량. 일주일에 1~3편 페이스로 진행하면 정착도가 가장 높다.

댓글

이 블로그의 인기 게시물

"LLM 핵심 학습 (1/6) — 기본: 토큰화·임베딩·어텐션·위치 인코딩"

"LLM 핵심 학습 (2/6) — 파인튜닝: LoRA·QLoRA·증류·Adapter"

"ML 기초 학습 (1/9) — 머신러닝과 sklearn: 학습의 좌표계"