AI 연구 에이전트의 실패 모드 — 답이 틀린 게 아니라, 일을 안 끝낸다

조기 반환(Premature Return) 문제와 완료 계약(Completion Contract) 설계

핵심 요약

mir 에이전트가 researcher에게 다이킨 에어컨 제품 조사를 요청했습니다. 특정 용량, 가격대, 설치 환경에 맞는 모델 후보군과 공식 사양 수집이라는 명확한 조건이 있었습니다.

반환된 결과는 실질적 내용 없는 빈 결과와 방대한 '다음에 할 일 목록'이었습니다. 표면적으로는 "응답 성공"이지만, 실제로 완료된 내용은 없었습니다.

일반적으로 LLM 에이전트 실패라면 환각을 떠올리지만, 실제 운영에서 더 자주 나타나는 실패는 조기 반환입니다. 에이전트가 요청 조건 충족 전에 작업을 완료했다고 판단하고 결과를 반환하는 현상입니다.

더 문제인 점은 "앞으로 수행할 계획"을 실제 연구 결과처럼 포장하여 반환한다는 것입니다.

시스템은 역할 정의, 제약 사항, 도구 사용법은 제공했으나, "어떤 상태가 되었을 때 작업이 완료인지"에 대한 명확한 계약이 없었습니다.

"완료가 아닌" 상황을 명시적으로 정의: - 출력이 비어있거나 플레이스홀더만 있는 경우 - 출력이 연구 계획이나 TODO 리스트인 경우 - 주장에 대한 출처 URL 누락 - 미확인 항목을 명시적으로 표기하지 않은 경우

2단계 검증 흐름 강제:

Stage 1 (후보 수집): 다각적 키워드 검색 → 공식 문서 필터링 → 최소 3개 후보 확보

Stage 2 (검증 및 합성): 공식 스펙 시트 확인 → 최소 2개 출처 교차 검증 → [확인됨/미확인/정보없음] 분류

에이전트에게 "무엇을 하라"는 잘 전달하지만, "언제 끝난 것인지"는 잘 전달하지 않습니다. 완료 계약을 명시하는 것만으로 에이전트의 실질적 성공률이 크게 올라갔습니다.