LLM 추론 모드 시리즈 (6편)

LLM 추론 모드 시리즈 (6편)

테스트타임 컴퓨트·Claude Thinking·effort(low~max)·OpenAI reasoning_effort까지, 추론 다이얼 완전 해부


선수 지식LLM 핵심 학습 시리즈 (권장)
다음 시리즈AI 운영 경제학 시리즈 (4편)

전체 편 목록

1LLM 추론 모드 (1/6) — 왜 '생각'에 비용이 드는가: 테스트타임 컴퓨트와 추론 토큰
2LLM 추론 모드 (2/6) — Claude의 Thinking: 고정 예산에서 adaptive로
3LLM 추론 모드 (3/6) — Claude effort 완전 해부: low·medium·high·xhigh·max
4LLM 추론 모드 (4/6) — Claude Code의 effort 실전: low·medium·high·xhigh·max와 ultracode
5LLM 추론 모드 (5/6) — OpenAI·Codex의 reasoning_effort: minimal부터 xhigh까지
6LLM 추론 모드 (6/6) — 비교와 실전 가이드: 비용·지연·품질, 그리고 어느 다이얼을 언제

권장 학습 페이스

편당 평균 15~25분 분량. 1편(원리)부터 순서대로 읽으면 effort·reasoning_effort 다이얼 선택 기준이 잡힌다.

댓글

이 블로그의 인기 게시물

"LLM 핵심 학습 (1/6) — 기본: 토큰화·임베딩·어텐션·위치 인코딩"

"LLM 핵심 학습 (2/6) — 파인튜닝: LoRA·QLoRA·증류·Adapter"

"ML 기초 학습 (1/9) — 머신러닝과 sklearn: 학습의 좌표계"