AI 연구 에이전트의 실패 모드 — 답이 틀린 게 아니라, 일을 안 끝낸다

AI 연구 에이전트의 실패 모드 — 답이 틀린 게 아니라, 일을 안 끝낸다

조기 반환(Premature Return) 문제와 완료 계약(Completion Contract) 설계


핵심 요약

  • AI 에이전트의 실제 실패 모드는 환각이 아니라 "조기 반환" — 작업 완료 전에 결과를 반환하는 현상
  • 원인은 에이전트에게 '완료 조건'을 명시하지 않았기 때문
  • 2단계 검증 흐름(수집 + 검증)과 명시적 완료 계약으로 해결

배경

mir 에이전트가 researcher에게 다이킨 에어컨 제품 조사를 요청했습니다. 특정 용량, 가격대, 설치 환경에 맞는 모델 후보군과 공식 사양 수집이라는 명확한 조건이 있었습니다.

반환된 결과는 실질적 내용 없는 빈 결과와 방대한 '다음에 할 일 목록'이었습니다. 표면적으로는 "응답 성공"이지만, 실제로 완료된 내용은 없었습니다.

본문

핵심 인사이트: 조기 반환(Premature Return)

일반적으로 LLM 에이전트 실패라면 환각을 떠올리지만, 실제 운영에서 더 자주 나타나는 실패는 조기 반환입니다. 에이전트가 요청 조건 충족 전에 작업을 완료했다고 판단하고 결과를 반환하는 현상입니다.

더 문제인 점은 "앞으로 수행할 계획"을 실제 연구 결과처럼 포장하여 반환한다는 것입니다.

해결: 완료 계약(Completion Contract)

원인: 완료 조건 부재

시스템은 역할 정의, 제약 사항, 도구 사용법은 제공했으나, "어떤 상태가 되었을 때 작업이 완료인지"에 대한 명확한 계약이 없었습니다.

해결: 완료 계약(Completion Contract)

"완료가 아닌" 상황을 명시적으로 정의: - 출력이 비어있거나 플레이스홀더만 있는 경우 - 출력이 연구 계획이나 TODO 리스트인 경우 - 주장에 대한 출처 URL 누락 - 미확인 항목을 명시적으로 표기하지 않은 경우

2단계 검증 흐름 강제:

Stage 1 (후보 수집): 다각적 키워드 검색 → 공식 문서 필터링 → 최소 3개 후보 확보

Stage 2 (검증 및 합성): 공식 스펙 시트 확인 → 최소 2개 출처 교차 검증 → [확인됨/미확인/정보없음] 분류

적용 결과

항목 이전(실패) 이후(성공)
출력 내용 실질 내용 없음 + 향후 계획 구체적 모델 목록 + URL + 스펙 테이블
공식 문서 참조 없음 공식 홈페이지 직접 확인
미확인 처리 암묵적 생략 명시적 표기

시행착오 / 주의사항

  • 시작 조건이 있다면 완료 조건도 반드시 명시해야 합니다.
  • 실패 모드를 미리 열거하면, 에이전트가 "좋은 결과"와 "나쁜 결과"의 기준을 학습합니다.
  • 2단계 흐름(수집 + 검증)이 단일 패스보다 안정적입니다.

마무리

에이전트에게 "무엇을 하라"는 잘 전달하지만, "언제 끝난 것인지"는 잘 전달하지 않습니다. 완료 계약을 명시하는 것만으로 에이전트의 실질적 성공률이 크게 올라갔습니다.

댓글

이 블로그의 인기 게시물

"LLM 핵심 학습 (1/6) — 기본: 토큰화·임베딩·어텐션·위치 인코딩"

"LLM 핵심 학습 (2/6) — 파인튜닝: LoRA·QLoRA·증류·Adapter"

"ML 기초 학습 (1/9) — 머신러닝과 sklearn: 학습의 좌표계"