"프롬프트 고급 2026 — 역할·예시·체이닝 실전 응용"

Anthropic 4-Block 공식 + 4가지 체이닝 패턴 + Self-Critique 루프


핵심 요약

  • 대상 독자: 입문편 5가지 패턴을 이해한 사용자. 프롬프트 한 번에 끝내지 않고 여러 단계로 결과 품질을 끌어올리려는 사람.
  • 얻을 것: 1) 역할 프롬프트 4-Block 공식 2) 예시(Few-shot)의 진짜 강점과 함정 3) 프롬프트 체이닝 4가지 패턴 4) Self-Critique 루프 만드는 법 5) 메타 프롬프팅 — AI에게 프롬프트 쓰게 하기.
  • 핵심 차이: 입문편이 "한 번에 잘 묻기"였다면, 고급은 "여러 번 나눠 묻기" + "AI에게 답을 다듬게 하기".

1. 역할 프롬프트 — 4-Block 공식

너는 [전문가]야만 쓰면 부족하다. 다음 4 블록으로 정교화한다.

Block 1: 역할 (Role)

누구인가 + 무엇을 잘하는가.

"너는 12년 경력의 IT 스타트업 전문 변호사다. SaaS·B2B 계약 분쟁에서 공급자(서비스 제공 측) 보호에 특화되어 있다."

Block 2: 청중 (Audience)

누구를 위해 답하는가.

"내 청중은 기술 배경이 있지만 법률 지식은 부족한 1인 창업자다. 법률 용어는 첫 등장 시 한 줄 설명을 추가해라."

Block 3: 임무 (Task)

정확히 무엇을 산출해야 하는가.

"다음 SaaS 계약서 초안을 검토해서 1) 우리 측 위험 조항 2) 모호한 표현 3) 추가해야 할 보호 조항을 정리해라."

Block 4: 제약 (Constraints)

하지 말아야 할 것 + 형식 강제.

"추측하지 마라. 근거 조항을 인용해라. 출력은 한국어, Markdown 표 형식, 각 항목 1~2줄."

이 4-Block을 시스템 프롬프트로 분리하면 같은 페르소나로 여러 질문을 이어갈 수 있다. ChatGPT는 Custom GPTs, Claude는 Project, Gemini는 Gem에 저장.


2. 예시(Few-shot) — 진짜 강점과 함정

입문편에서 "예시 1~2개로 7.48% 정확도 상승"을 다뤘다. 고급은 그 품질을 다룬다.

2.1 다양성이 양보다 중요

같은 패턴 5개 < 다른 패턴 2개. 모델은 예시들의 공통점을 패턴으로 잡기 때문이다.

나쁜 예시 모음 (모두 비슷)

일기 → 트윗 변환 예시 5개가 전부 "음식 + 줄 서기" 주제

좋은 예시 모음 (다양)

  1. 음식·줄서기, 2. 영화·감동, 3. 운동·고통, 4. 출근·피로

2.2 Contrastive (대조) 예시

"이건 X, 저건 Y"로 줄 때 더 잘 학습한다.

"다음 두 답변 중 두 번째 스타일을 따라줘. 답변 A (X): 격식체, 길고 형식적 답변 B (O): 친근한 말투, 짧고 핵심만"

2.3 함정: 예시 패턴이 너무 강하면 다양성 잃음

요청 자체가 다양성을 요구할 때(브레인스토밍 등)는 예시를 빼거나 1개만. 예시 = 답안지 = 모델이 그것에 수렴.


3. 프롬프트 체이닝 — 한 번에 안 끝내고 나눠 묻기

복잡한 작업은 3~5단계로 분할하면 정확도와 디버깅 용이성이 올라간다 (Prompt chaining 2026 가이드).

3.1 4가지 표준 패턴

패턴 단계 적합 작업
Analyze → Plan → Draft → Refine 분석 → 계획 → 초안 → 다듬기 글쓰기, 발표 자료
Extract → Transform → Summarize 추출 → 변환 → 요약 데이터·자료 정리
Classify → Route → Generate 분류 → 분기 → 생성 고객 문의 처리, 트리아지
Generate → Critique → Improve 생성 → 비평 → 개선 코드, 디자인 안

3.2 실전 예 — 블로그 글 작성 (Analyze → Plan → Draft → Refine)

[1단계 — Analyze]
"내가 다룰 주제는 'AI 자동화 입문'이다.
독자 수준, 검색 의도, 경쟁 글의 공통점·약점을 정리해라."

[2단계 — Plan]
"위 분석을 바탕으로 7개 H2 섹션 아우트라인을 만들어라.
각 섹션에 핵심 메시지·예상 분량을 명시해라."

[3단계 — Draft]
"위 아웃라인 중 섹션 3을 한국어로 풀어 써라.
마크다운 형식, 700자."

[4단계 — Refine]
"방금 초안에서:
1. 추상적 표현 ('많은 사람들이') 제거
2. 출처가 필요한 수치는 '[출처 필요]' 표시
3. 첫 문장 더 강하게."

각 단계의 출력을 다음 단계 입력으로 넣는다. ChatGPT/Claude/Gemini 웹 UI도 같은 채팅 안에서 자연스럽게 이어진다.

3.3 모델 분리 전략

체이닝의 숨겨진 이점: 각 단계마다 다른 모델을 써도 된다. 단순 추출은 Haiku/GPT-4o-mini, 추론은 Sonnet/Opus, 창의적 생성은 GPT-5.4 Pro 식으로. 한 가이드 추정에 따르면 약 70%까지 비용 절감 가능하다 (SurePrompts 2026).


4. Self-Critique 루프

Generate → Critique → Improve 패턴을 한 프롬프트 안에 넣어버리는 방법.

4.1 단일 프롬프트 버전

"다음 작업을 3단계로 수행해라. 1단계: [작업]을 수행해 초안을 작성 2단계: 1단계 결과를 비평가 입장에서 비판 (3가지 약점) 3단계: 비판을 반영한 개선안을 제시

작업: 30초 짜리 광고 카피 작성. 제품: 친환경 텀블러."

모델이 자기 답을 스스로 비판하고 개선하는 흐름이 한 번의 응답에 다 들어간다.

4.2 다중 프롬프트 버전 (더 강력)

각 단계를 분리된 호출로 실행하면 더 깊은 비평이 나온다. 비평 단계에 "비평가는 다른 페르소나"를 부여하면 효과 증폭.

"[1] 너는 카피라이터다. 광고 초안을 써라. [2] (다음 호출) 너는 마케팅 디렉터다. 위 초안의 약점을 3가지 짚어라. [3] (다음 호출) 너는 다시 카피라이터. 약점을 보완한 v2를 써라."

4.3 Self-Consistency

여러 번 같은 프롬프트로 답을 받고 다수결을 채택하는 기법 (Wang et al., 2022, arXiv:2203.11171). 단순 추론에선 강력하지만 비용이 N배. 핵심 결정에만 사용.


5. 메타 프롬프팅 — AI에게 프롬프트 쓰게 하기

가장 게으르면서도 효과적인 기법: AI에게 더 좋은 프롬프트를 써달라고 부탁.

"다음 작업을 위한 프롬프트 3가지 버전을 만들어라. 각 버전은 다른 접근 (1) 구체화 강화 (2) 예시 추가 (3) 역할 부여.

작업: 고객 컴플레인 메일에 대한 답장 작성."

받은 3개 버전 중 가장 좋은 걸로 실제 작업을 진행한다. 또는 그것들을 조합한다. Anthropic Console의 Prompt Generator도 정확히 이 일을 한다 (Anthropic 공식).

메타 프롬프팅이 빛나는 순간

  • 같은 작업을 100번 반복할 예정 (자동화·배치)
  • 프로덕션 시스템에 들어갈 시스템 프롬프트
  • 도메인 전문가가 아닌 영역 (변호사·의사 페르소나)

6. 정리 — 언제 어떤 패턴을 쓰는가

상황 첫 시도 안 되면 추가
일회성 질문 입문편 5패턴 단계별 사고("step by step")
긴 글·자료 작성 4-Block 역할 Analyze → Plan → Draft → Refine 체이닝
정밀한 추론 Chain of Thought Self-Consistency (비용 감수)
코드 리뷰·디버깅 Generate → Critique → Improve 다중 페르소나 비평
자동화·배치 작업 시스템 프롬프트 + Few-shot 메타 프롬프팅으로 시스템 프롬프트 자동 생성

개발자 팁

API 환경에서 추가로 활용할 것:

  1. 체이닝 = 토큰·요금 N배: 4단계 체인 = 4번 호출. 각 단계 출력이 다음 입력으로 들어가므로 누적 토큰이 빠르게 증가. Prompt caching (Anthropic·OpenAI·Google 모두 지원) 을 적극 활용.
  2. 체이닝 ≠ ReAct/Tool Use: 체이닝은 사람이 단계 정의, ReAct/Agent는 모델이 단계 결정. 입문 단계는 체이닝부터.
  3. Self-Consistency 구현: temperature ≥ 0.7로 N번 호출 → 답을 모아 majority vote 또는 LLM judge로 선택.
  4. 모델 분리 절약: LangChain·LlamaIndex로 라우팅 가능. 각 단계의 모델을 명시적으로 지정.
  5. 메타 프롬프팅 자동화: Anthropic Prompt Improver API. 기존 프롬프트를 자동 개선해 반환.
  6. 평가 (eval) 필수: 체이닝·메타 프롬프팅은 자유도가 커서 회귀 발생 쉬움. 골든 셋 10~20개 + LLM judge로 자동 평가 파이프라인을 구축.

참고


이 글은 AI 입문 시리즈의 3-2/11 편입니다. 다음 편: AI 학습 도구 — NotebookLM + Perplexity 실전 활용.

댓글

이 블로그의 인기 게시물

"LLM 핵심 학습 (1/6) — 기본: 토큰화·임베딩·어텐션·위치 인코딩"

"LLM 핵심 학습 (2/6) — 파인튜닝: LoRA·QLoRA·증류·Adapter"

"ML 기초 학습 (1/9) — 머신러닝과 sklearn: 학습의 좌표계"