"프롬프트 고급 2026 — 역할·예시·체이닝 실전 응용"
Anthropic 4-Block 공식 + 4가지 체이닝 패턴 + Self-Critique 루프
핵심 요약
- 대상 독자: 입문편 5가지 패턴을 이해한 사용자. 프롬프트 한 번에 끝내지 않고 여러 단계로 결과 품질을 끌어올리려는 사람.
- 얻을 것: 1) 역할 프롬프트 4-Block 공식 2) 예시(Few-shot)의 진짜 강점과 함정 3) 프롬프트 체이닝 4가지 패턴 4) Self-Critique 루프 만드는 법 5) 메타 프롬프팅 — AI에게 프롬프트 쓰게 하기.
- 핵심 차이: 입문편이 "한 번에 잘 묻기"였다면, 고급은 "여러 번 나눠 묻기" + "AI에게 답을 다듬게 하기".
1. 역할 프롬프트 — 4-Block 공식
너는 [전문가]야만 쓰면 부족하다. 다음 4 블록으로 정교화한다.
Block 1: 역할 (Role)
누구인가 + 무엇을 잘하는가.
"너는 12년 경력의 IT 스타트업 전문 변호사다. SaaS·B2B 계약 분쟁에서 공급자(서비스 제공 측) 보호에 특화되어 있다."
Block 2: 청중 (Audience)
누구를 위해 답하는가.
"내 청중은 기술 배경이 있지만 법률 지식은 부족한 1인 창업자다. 법률 용어는 첫 등장 시 한 줄 설명을 추가해라."
Block 3: 임무 (Task)
정확히 무엇을 산출해야 하는가.
"다음 SaaS 계약서 초안을 검토해서 1) 우리 측 위험 조항 2) 모호한 표현 3) 추가해야 할 보호 조항을 정리해라."
Block 4: 제약 (Constraints)
하지 말아야 할 것 + 형식 강제.
"추측하지 마라. 근거 조항을 인용해라. 출력은 한국어, Markdown 표 형식, 각 항목 1~2줄."
이 4-Block을 시스템 프롬프트로 분리하면 같은 페르소나로 여러 질문을 이어갈 수 있다. ChatGPT는 Custom GPTs, Claude는 Project, Gemini는 Gem에 저장.
2. 예시(Few-shot) — 진짜 강점과 함정
입문편에서 "예시 1~2개로 7.48% 정확도 상승"을 다뤘다. 고급은 그 품질을 다룬다.
2.1 다양성이 양보다 중요
같은 패턴 5개 < 다른 패턴 2개. 모델은 예시들의 공통점을 패턴으로 잡기 때문이다.
나쁜 예시 모음 (모두 비슷)
일기 → 트윗 변환 예시 5개가 전부 "음식 + 줄 서기" 주제
좋은 예시 모음 (다양)
- 음식·줄서기, 2. 영화·감동, 3. 운동·고통, 4. 출근·피로
2.2 Contrastive (대조) 예시
"이건 X, 저건 Y"로 줄 때 더 잘 학습한다.
"다음 두 답변 중 두 번째 스타일을 따라줘. 답변 A (X): 격식체, 길고 형식적 답변 B (O): 친근한 말투, 짧고 핵심만"
2.3 함정: 예시 패턴이 너무 강하면 다양성 잃음
요청 자체가 다양성을 요구할 때(브레인스토밍 등)는 예시를 빼거나 1개만. 예시 = 답안지 = 모델이 그것에 수렴.
3. 프롬프트 체이닝 — 한 번에 안 끝내고 나눠 묻기
복잡한 작업은 3~5단계로 분할하면 정확도와 디버깅 용이성이 올라간다 (Prompt chaining 2026 가이드).
3.1 4가지 표준 패턴
| 패턴 | 단계 | 적합 작업 |
|---|---|---|
| Analyze → Plan → Draft → Refine | 분석 → 계획 → 초안 → 다듬기 | 글쓰기, 발표 자료 |
| Extract → Transform → Summarize | 추출 → 변환 → 요약 | 데이터·자료 정리 |
| Classify → Route → Generate | 분류 → 분기 → 생성 | 고객 문의 처리, 트리아지 |
| Generate → Critique → Improve | 생성 → 비평 → 개선 | 코드, 디자인 안 |
3.2 실전 예 — 블로그 글 작성 (Analyze → Plan → Draft → Refine)
[1단계 — Analyze]
"내가 다룰 주제는 'AI 자동화 입문'이다.
독자 수준, 검색 의도, 경쟁 글의 공통점·약점을 정리해라."
[2단계 — Plan]
"위 분석을 바탕으로 7개 H2 섹션 아우트라인을 만들어라.
각 섹션에 핵심 메시지·예상 분량을 명시해라."
[3단계 — Draft]
"위 아웃라인 중 섹션 3을 한국어로 풀어 써라.
마크다운 형식, 700자."
[4단계 — Refine]
"방금 초안에서:
1. 추상적 표현 ('많은 사람들이') 제거
2. 출처가 필요한 수치는 '[출처 필요]' 표시
3. 첫 문장 더 강하게."
각 단계의 출력을 다음 단계 입력으로 넣는다. ChatGPT/Claude/Gemini 웹 UI도 같은 채팅 안에서 자연스럽게 이어진다.
3.3 모델 분리 전략
체이닝의 숨겨진 이점: 각 단계마다 다른 모델을 써도 된다. 단순 추출은 Haiku/GPT-4o-mini, 추론은 Sonnet/Opus, 창의적 생성은 GPT-5.4 Pro 식으로. 한 가이드 추정에 따르면 약 70%까지 비용 절감 가능하다 (SurePrompts 2026).
4. Self-Critique 루프
Generate → Critique → Improve 패턴을 한 프롬프트 안에 넣어버리는 방법.
4.1 단일 프롬프트 버전
"다음 작업을 3단계로 수행해라. 1단계: [작업]을 수행해 초안을 작성 2단계: 1단계 결과를 비평가 입장에서 비판 (3가지 약점) 3단계: 비판을 반영한 개선안을 제시
작업: 30초 짜리 광고 카피 작성. 제품: 친환경 텀블러."
모델이 자기 답을 스스로 비판하고 개선하는 흐름이 한 번의 응답에 다 들어간다.
4.2 다중 프롬프트 버전 (더 강력)
각 단계를 분리된 호출로 실행하면 더 깊은 비평이 나온다. 비평 단계에 "비평가는 다른 페르소나"를 부여하면 효과 증폭.
"[1] 너는 카피라이터다. 광고 초안을 써라. [2] (다음 호출) 너는 마케팅 디렉터다. 위 초안의 약점을 3가지 짚어라. [3] (다음 호출) 너는 다시 카피라이터. 약점을 보완한 v2를 써라."
4.3 Self-Consistency
여러 번 같은 프롬프트로 답을 받고 다수결을 채택하는 기법 (Wang et al., 2022, arXiv:2203.11171). 단순 추론에선 강력하지만 비용이 N배. 핵심 결정에만 사용.
5. 메타 프롬프팅 — AI에게 프롬프트 쓰게 하기
가장 게으르면서도 효과적인 기법: AI에게 더 좋은 프롬프트를 써달라고 부탁.
"다음 작업을 위한 프롬프트 3가지 버전을 만들어라. 각 버전은 다른 접근 (1) 구체화 강화 (2) 예시 추가 (3) 역할 부여.
작업: 고객 컴플레인 메일에 대한 답장 작성."
받은 3개 버전 중 가장 좋은 걸로 실제 작업을 진행한다. 또는 그것들을 조합한다. Anthropic Console의 Prompt Generator도 정확히 이 일을 한다 (Anthropic 공식).
메타 프롬프팅이 빛나는 순간
- 같은 작업을 100번 반복할 예정 (자동화·배치)
- 프로덕션 시스템에 들어갈 시스템 프롬프트
- 도메인 전문가가 아닌 영역 (변호사·의사 페르소나)
6. 정리 — 언제 어떤 패턴을 쓰는가
| 상황 | 첫 시도 | 안 되면 추가 |
|---|---|---|
| 일회성 질문 | 입문편 5패턴 | 단계별 사고("step by step") |
| 긴 글·자료 작성 | 4-Block 역할 | Analyze → Plan → Draft → Refine 체이닝 |
| 정밀한 추론 | Chain of Thought | Self-Consistency (비용 감수) |
| 코드 리뷰·디버깅 | Generate → Critique → Improve | 다중 페르소나 비평 |
| 자동화·배치 작업 | 시스템 프롬프트 + Few-shot | 메타 프롬프팅으로 시스템 프롬프트 자동 생성 |
개발자 팁
API 환경에서 추가로 활용할 것:
- 체이닝 = 토큰·요금 N배: 4단계 체인 = 4번 호출. 각 단계 출력이 다음 입력으로 들어가므로 누적 토큰이 빠르게 증가. Prompt caching (Anthropic·OpenAI·Google 모두 지원) 을 적극 활용.
- 체이닝 ≠ ReAct/Tool Use: 체이닝은 사람이 단계 정의, ReAct/Agent는 모델이 단계 결정. 입문 단계는 체이닝부터.
- Self-Consistency 구현: temperature ≥ 0.7로 N번 호출 → 답을 모아 majority vote 또는 LLM judge로 선택.
- 모델 분리 절약: LangChain·LlamaIndex로 라우팅 가능. 각 단계의 모델을 명시적으로 지정.
- 메타 프롬프팅 자동화: Anthropic Prompt Improver API. 기존 프롬프트를 자동 개선해 반환.
- 평가 (eval) 필수: 체이닝·메타 프롬프팅은 자유도가 커서 회귀 발생 쉬움. 골든 셋 10~20개 + LLM judge로 자동 평가 파이프라인을 구축.
참고
- Anthropic — Prompting best practices
- Anthropic — Prompt Improver
- Prompt Engineering Guide — Prompt Chaining
- Prompt Engineering Guide — Self-Consistency
- Self-Consistency 논문 (Wang et al., 2022)
- SurePrompts — Prompt Chaining 2026 Guide
이 글은 AI 입문 시리즈의 3-2/11 편입니다. 다음 편: AI 학습 도구 — NotebookLM + Perplexity 실전 활용.
댓글
댓글 쓰기