에이전트 운영 설계 노트 (1/9) — Managed Agents 시대, 팀이 직접 설계해야 하는 것

2026년 들어 OpenAI, Anthropic, Google이 모두 Managed Agents 계층을 전면에 내놓기 시작했다. 이 흐름만 보면 이제 에이전트 운영 문제의 상당 부분이 플랫폼으로 흡수되는 것처럼 보인다. 하지만 실제로는 반만 맞다. 플랫폼이 대신해 줄 수 있는 층은 분명히 늘어났지만, 팀이 끝까지 직접 설계하고 소유해야 하는 층도 오히려 더 선명해지고 있다.


핵심 요약

  • Managed Agents는 장시간 실행, 기본 도구 연결, 호스팅, 일부 관측과 같은 운영층을 제품으로 흡수하기 시작했다.
  • 하지만 그 자체로 팀의 업무 규칙, 권한 경계, handoff 구조, memory ownership까지 해결해 주지는 않는다.
  • 특히 어떤 지시를 상위 규칙으로 둘 것인가, 어떤 행동에 승인 게이트를 둘 것인가, 중단 뒤 어떻게 이어 붙일 것인가는 여전히 로컬 하네스 설계 문제다.
  • 그래서 앞으로 중요한 질문은 직접 만들까, 사서 쓸까가 아니라 무엇을 맡기고 무엇을 계속 소유할까에 가깝다.

1. Managed Agents는 왜 2026년에 갑자기 중요해졌나

지난 글에서 정리했듯, 2025년이 에이전트의 가능성을 연 해였다면 2026년은 그 가능성이 운영 계층으로 굳어지기 시작한 해다. 그 신호가 가장 선명하게 드러난 지점이 바로 Managed Agents다.

이 세 발표는 공통된 방향을 보여 준다. 이제 플랫폼은 단순히 모델을 제공하는 데서 멈추지 않고, 더 오래 실행되고 더 많은 도구를 다루며 더 조직적으로 공유되는 에이전트 운영층 자체를 제품으로 제공하려 한다.

이 흐름은 분명 중요하다. 하지만 여기서 곧바로 "이제 에이전트 하네스를 팀이 직접 설계할 필요가 없다"라고 결론 내리면 과장이다.

2. Managed Agents가 실제로 해결해 주는 문제

Managed Agents가 강한 이유는 분명하다. 직접 운영할 때 가장 먼저 부딪히는 몇 가지 반복 비용을 흡수해 주기 때문이다.

보통 아래 영역이 여기에 들어간다.

영역 Managed Agents가 줄여 주는 부담
장시간 실행 세션이 클라우드에서 계속 살아 있고 작업이 이어짐
기본 런타임 모델 호출, 작업 루프, 상태 유지 일부를 플랫폼이 담당
기본 도구 연결 검색, 파일, 코드, 브라우저 같은 공통 능력 연결
기본 관측 실행 로그, 진행 상태, 일부 tracing/visibility 제공
공유 배포 개인 실험이 아니라 팀용 agent로 배포 가능

이 다섯 가지만 해도 현장에서는 굉장히 크다. 예전에는 팀이 직접 프롬프트 레이어를 만들고, 툴 호출 구조를 붙이고, 장시간 실행을 유지하고, 중간 상태를 관리하고, 실패를 확인할 표면을 따로 구성해야 했다.

Managed Agents는 이 운영비를 크게 줄여 준다. 따라서 에이전트 실험에이전트 배치 쪽으로 끌어올리는 데는 분명 도움이 된다.

문제는 그다음이다.

3. 그러나 플랫폼이 대신할 수 없는 층도 있다

Managed Agents가 등장했다고 해서 팀의 운영 책임이 사라지는 것은 아니다. 오히려 어느 층을 플랫폼에 맡기고 어느 층을 직접 소유할지 구분해야 할 필요가 더 커진다.

그 이유는 간단하다.

플랫폼은 공통 실행층을 잘 제공할 수 있어도, 당신 팀의 업무 규칙까지 대신 소유할 수는 없다.

예를 들어 플랫폼은 장시간 실행을 제공할 수 있다. 하지만 "어떤 문서를 우선 규칙으로 읽어야 하는가"는 여전히 팀마다 다르다. 플랫폼은 기본 검색 도구를 줄 수 있다. 하지만 "외부 전송은 언제 승인받아야 하는가"는 조직 정책 문제다. 플랫폼은 메모리나 상태 저장을 일부 도와줄 수 있다. 하지만 "무엇을 장기 자산으로 남기고 무엇을 일회성 상태로 버릴 것인가"는 제품과 조직의 판단이다.

즉, Managed Agents는 공통 문제를 줄여 주지만, 로컬 운영 철학을 대체하지는 못한다.

4. 팀이 여전히 직접 설계해야 하는 첫 번째 층: 지시 구조

에이전트가 같은 모델과 같은 도구를 써도 팀마다 전혀 다른 결과가 나오는 가장 큰 이유 중 하나는 지시 구조가 다르기 때문이다.

직접 설계가 필요한 질문은 이런 것들이다.

  • 시스템 지시와 프로젝트 지시를 어떻게 나눌 것인가
  • 저장소별 규칙과 사용자별 요청 충돌 시 우선순위를 어떻게 둘 것인가
  • 언제 계획을 먼저 세우고 언제 바로 실행하게 할 것인가
  • 어떤 작업은 반드시 검증을 거치게 만들 것인가

이건 단지 프롬프트 작성 팁이 아니다. 에이전트의 기본 행동 철학을 결정하는 설계다.

Managed runtime이 아무리 좋아도, 지시 구조가 흐리면 에이전트는 같은 곳에서 계속 흔들린다. 그래서 지시 구조는 플랫폼 기능이 아니라 팀의 운영 규약에 더 가깝다.

5. 두 번째 층: 권한 정책과 승인 경계

Managed Agents 시대에 더 중요해지는 것은 오히려 권한 설계다. 이유는 단순하다. 에이전트가 더 오래, 더 많이, 더 실제적으로 일하게 될수록 잘못된 행동의 반경도 커지기 때문이다.

여기서 팀이 직접 정해야 하는 질문은 뚜렷하다.

  • 읽기와 쓰기를 같은 수준으로 허용할 것인가
  • 외부 전송은 항상 사람 승인 뒤에 두는가
  • 코드를 수정한 뒤 테스트 없이 다음 단계로 넘어가게 둘 것인가
  • 브라우저 조작, 셸 실행, 메시지 발송을 같은 위험도로 볼 것인가

이런 질문은 플랫폼의 기본 가드레일만으로는 충분히 답해지지 않는다. 실제 운영에서는 조직의 승인 흐름, 감사 요구, 실수 허용 범위가 다르기 때문이다.

그래서 샌드박스와 approval flow는 제품 기능인 동시에 로컬 정책이다. 플랫폼이 기능을 제공하더라도, 그 기능을 어디까지 열고 어디서 막을지는 팀이 직접 설계해야 한다.

6. 세 번째 층: handoff와 장시간 작업 구조

장시간 에이전트 운영 글에서 정리했듯, 긴 작업의 핵심은 메모리 일반론보다 먼저 어디서 멈췄고 어떻게 다시 이어 붙일 것인가를 외부 구조로 남기는 데 있다.

Managed Agents도 장시간 실행을 도와줄 수는 있다. 하지만 다음 질문까지 자동으로 풀어 주지는 않는다.

  • 중간 상태를 어떤 형식으로 남길 것인가
  • 다음 세션이 무엇부터 읽어야 하는가
  • 검증되지 않은 상태를 어디에 기록할 것인가
  • 사람이 중간에 개입했을 때 어디서 재개할 것인가

이건 단순 상태 저장이 아니라 handoff 설계 문제다. 좋은 운영은 과거를 많이 기억하는 것이 아니라, 다음 행동을 좁혀 주는 외부 artifact를 남기는 데서 나온다.

즉, 장시간 실행 기능이 있다고 해서 장시간 운영 구조가 저절로 생기지는 않는다.

7. 네 번째 층: memory ownership

Managed Agents가 널리 쓰이기 시작할수록 메모리를 누가 소유하는가의 문제가 더 중요해진다.

이 질문은 겉보기보다 크다.

  • 어떤 지식을 장기 자산으로 축적할 것인가
  • 어떤 메모리는 특정 프로젝트 전용인가
  • 모델이나 플랫폼을 바꾸면 그 기억을 옮길 수 있는가
  • 누가 stale memory를 정리하고, 누가 기준을 바꾸는가

플랫폼이 메모리 기능을 제공하는 것은 편하다. 하지만 팀이 그 구조를 전혀 소유하지 않으면 두 가지 위험이 생긴다.

  1. 운영 지식이 플랫폼 내부 기능에 잠긴다.
  2. 조직의 판단 로직과 재사용 자산을 이식하기 어려워진다.

그래서 memory ownership은 "메모리를 직접 구현할까 말까"의 문제가 아니다. 핵심은 무엇을 우리 자산으로 볼 것인가다.

8. Build vs Buy가 아니라 Buy + Own으로 봐야 한다

Managed Agents 논의가 자주 헛도는 이유는 질문을 너무 이분법으로 잡기 때문이다.

  • 직접 다 만들 것인가
  • 아니면 전부 플랫폼에 맡길 것인가

실제로는 둘 다 과하다. 대부분의 팀에게 더 현실적인 모델은 buy + own이다.

즉, 공통 실행층은 사되, 아래 층은 직접 소유하는 방식이다.

플랫폼에 맡기기 좋은 층 직접 소유해야 하는 층
호스팅 런타임 지시 구조
기본 작업 루프 권한 정책
공통 도구 연결 approval boundary
기본 observability handoff 구조
팀 공유 배포 memory ownership

이렇게 보면 설계가 훨씬 명확해진다. 플랫폼은 반복 인프라를 줄여 주고, 팀은 운영 철학과 업무 책임을 쥔다.

이 조합이 중요한 이유는, 에이전트 도입이 성공하는 조직은 대개 둘 중 하나만 잘하는 조직이 아니기 때문이다. 좋은 조직은 플랫폼 레버리지로컬 통제를 같이 잡는다.

9. 도입 전에 물어봐야 할 실무 질문

Managed Agents를 도입하거나 확장하기 전에 아래 질문부터 던지는 편이 좋다.

  1. 어떤 작업까지는 플랫폼 기본 가드레일로 충분한가
  2. 어떤 작업부터는 우리 승인 정책이 추가로 필요해지는가
  3. 중단 뒤 재개를 위해 외부에 남길 artifact는 무엇인가
  4. 장기 자산으로 남길 기억과 일회성 상태를 어떻게 나눌 것인가
  5. 플랫폼을 바꾸거나 병행해도 유지되어야 할 운영 규약은 무엇인가
  6. 실패했을 때 원인을 모델, 도구, 정책, handoff 중 어디서 추적할 것인가

이 질문에 답하지 않은 채 Managed Agents를 붙이면, 초기 속도는 빨라도 운영이 쌓일수록 경계가 흐려진다.

10. 결론: 플랫폼이 대신하는 층이 늘수록, 우리가 끝까지 소유해야 하는 층도 더 분명해진다

Managed Agents는 분명 2026년의 중요한 변화다. 이 계층 덕분에 에이전트는 더 쉽게 배포되고, 더 오래 실행되며, 더 많은 팀이 실험에서 운영으로 넘어갈 수 있게 된다.

하지만 그 사실과 "이제 하네스 설계가 불필요하다"는 결론은 전혀 다르다.

오히려 지금부터 더 중요해지는 것은 아래 네 가지다.

  • 어떤 지시 구조를 상위 규칙으로 둘 것인가
  • 어떤 권한과 승인 경계를 로컬 정책으로 묶을 것인가
  • 장시간 작업을 어떻게 handoff 구조로 외부화할 것인가
  • 어떤 메모리를 조직 자산으로 직접 소유할 것인가

즉, Managed Agents 시대의 핵심 질문은 "우리가 아무것도 설계하지 않아도 되는가"가 아니다.

더 정확한 질문은 이것이다. 플랫폼이 대신해 주는 층 위에서, 우리는 무엇을 끝까지 직접 소유해야 하는가.

이 질문에 답할 수 있어야 Managed Agents도 진짜 운영 도구가 된다.

함께 읽으면 좋은 글

참고 자료

시리즈 전체 안내: 시리즈 목차

댓글

이 블로그의 인기 게시물

"LLM 핵심 학습 (1/6) — 기본: 토큰화·임베딩·어텐션·위치 인코딩"

"LLM 핵심 학습 (2/6) — 파인튜닝: LoRA·QLoRA·증류·Adapter"

"ML 기초 학습 (1/9) — 머신러닝과 sklearn: 학습의 좌표계"