목차
Claude 가이드 - 이 글은 시리즈의 일부입니다.
이 글은 Claude API 공식 문서의 Adaptive Thinking 페이지를 정리한 글입니다. 원문: https://platform.claude.com/docs/en/build-with-claude/adaptive-thinking 마지막 확인: 2026-05-15
1. 한 줄 요약 #
질문이 어려우면 Claude가 알아서 더 오래 고민하고, 쉬우면 바로 답합니다 — 깊이 조절을 사람이 안 해도 됩니다.
2. 무엇이고 왜 좋을까 #
**적응형 사고(Adaptive Thinking)**는 Claude가 스스로 “이 질문은 깊게 생각해야겠다” “이건 그냥 바로 답하면 되겠다"를 판단하는 모드입니다.
택시 기사가 길이 막히면 돌아가고, 뻥 뚫렸으면 직진하는 것과 같습니다.
원래는 사람이 “이번엔 5,000 토큰만큼 생각해줘” 하고 일일이 숫자를 정해줘야 했어요. AI가 글자를 세는 단위인 토큰은, 쉽게 말해 “고민할 시간"이라고 보시면 됩니다. 그런데 사람이 매번 그 시간을 정해주는 건 번거롭잖아요. 적응형 사고는 그 결정을 Claude에게 맡깁니다.
핵심은 이겁니다: Claude Opus 4.7 모델에서는 이 모드가 유일한 추론 모드입니다. 즉, “생각하면서 답하는 Claude"를 쓰고 싶다면 적응형 사고로만 가능합니다.
3. 이런 상황에서 써요 #
상황 1: 학생 — 수학 문제와 한국사 질문을 섞어서 물어볼 때 #
시험 공부 중에 Claude에게 “1071과 462의 최대공약수가 뭐야?” 같은 수학 문제도 물어보고, “조선 후기 실학자 세 명만 알려줘” 같은 단순 암기 질문도 합니다.
수학 문제는 단계별로 풀어야 하니까 Claude가 천천히 생각해야 하고, 인물 이름은 그냥 알려주면 끝입니다. 적응형 사고를 켜두면 이 둘을 알아서 구분합니다. 사람이 “이번엔 깊게, 이번엔 얕게"를 신경 쓸 필요가 없어요.
상황 2: 직장인 — 회사 정책 챗봇을 만들 때 #
회사 휴가 규정을 Claude에게 미리 알려주고, 직원들의 질문에 답하는 챗봇을 만든다고 해봐요.
“연차 며칠 남았어요?” 같은 단순 질문은 즉답이 필요합니다. 반면 “출산휴가와 육아휴직을 어떻게 이어붙이면 가장 유리해요?“는 여러 규정을 조합해서 따져야 합니다. 사람이 매번 “이 질문은 깊게 생각해” 라벨을 붙일 수는 없잖아요. 적응형 사고에 맡기면 됩니다.
상황 3: 일반인 — 책 한 권을 두고 다양한 질문을 할 때 #
소설책 한 권을 Claude에게 통째로 넣어두고, 책 내용을 두고 이런저런 질문을 합니다.
“이 책 몇 페이지야?” 같은 사실 질문은 빠르게 답해야 합니다. “주인공이 마지막 장에서 그런 선택을 한 이유가 뭐라고 생각해?” 같은 해석 질문은 충분히 곱씹어봐야 합니다. 같은 책을 보면서도 질문의 무게가 매번 다른데, 적응형 사고는 그 차이를 알아서 잡아줍니다.
4. 가볍게 시작하기 #
💻 개발 경험이 있으신가요? 아래 코드는 Python 기준 가장 짧은 예시입니다. 비개발자라면 “아, 한 줄만 넣으면 되는구나” 정도로 보고 넘어가셔도 좋습니다.
import anthropic
client = anthropic.Anthropic()
response = client.messages.create(
model="claude-opus-4-7",
max_tokens=16000,
thinking={"type": "adaptive"}, # ← 이 한 줄이 적응형 사고 활성화
messages=[{
"role": "user",
"content": "1071과 462의 최대공약수는 무엇인가요?"
}],
)
print(response.content[-1].text)핵심은 딱 한 줄, thinking={"type": "adaptive"} 입니다. 이 한 줄을 넣으면 Claude가 질문을 받아보고 “오, 이건 단계별로 풀어야겠는데?” 하면서 알아서 깊게 사고를 시작합니다. 쉬운 질문이면 그냥 바로 답합니다.
max_tokens는 “답변 전체 길이 한도"입니다. 생각하는 부분과 답하는 부분을 합쳐서 이 한도 안에서만 쓰니까, 너무 짧게 잡으면 깊은 생각 중간에 답이 끊길 수 있어요. 처음엔 16,000 정도로 넉넉히 잡아두시면 안전합니다.
5. 흔한 오해와 함정 #
⚠️ 함정 1: “켜기만 하면 무조건 똑똑해지죠?” #
적응형 사고를 켰다고 모든 질문에서 Claude가 깊게 생각하는 건 아닙니다. 기본 설정에서는 거의 항상 생각하지만, 너무 단순한 질문(예: “프랑스 수도는?")은 생각을 건너뛰기도 합니다. 그게 정상입니다. 빠른 답이 더 도움 되는 상황까지 굳이 오래 고민하면 그게 더 손해니까요.
⚠️ 함정 2: “예전처럼 ‘5000 토큰 생각해줘’ 설정 못 쓰나요?” #
네, Claude Opus 4.7에서는 안 됩니다. 예전 방식인 budget_tokens 설정은 Opus 4.7에서 거부됩니다(400 에러). 적응형이 유일한 추론 모드예요. Opus 4.6과 Sonnet 4.6에서는 아직 옛 방식이 동작하지만, 곧 사라질 예정이라 적응형으로 옮기시는 게 좋습니다.
⚠️ 함정 3: “생각하는 글자가 안 보이는데, 안 생각하는 건가요?” #
Opus 4.7에서는 기본적으로 Claude의 생각 과정이 숨겨져서 응답에 나오지 않습니다(이전 모델은 요약본을 보여줬어요). 그래도 Claude는 안에서 충분히 생각하고 답을 준 거예요. 생각 과정을 보고 싶다면 display: "summarized" 옵션을 따로 켜시면 됩니다. 다만 생각한 만큼 비용은 똑같이 청구됩니다 — 보이지 않는다고 공짜는 아닙니다.
6. 한 단계 더 (관심 있는 분만) #
🎯 여기까지 오신 분 환영합니다. 이 섹션은 더 깊이 알고 싶은 분을 위한 보너스입니다. 본문만 읽으셔도 충분합니다.
생각의 양을 더 세밀히 조절하고 싶다면 effort(노력 수준) 옵션을 함께 쓸 수 있습니다. Claude에게 “이 정도 강도로 일해줘” 하고 부드럽게 안내하는 다이얼이에요.
| effort 값 | Claude의 행동 |
|---|---|
max |
제한 없이 깊게 생각 |
xhigh |
거의 항상 깊고 광범위하게 탐색 (Opus 4.7만 지원) |
high (기본값) |
거의 항상 생각함 |
medium |
중간 정도. 매우 단순한 질문은 건너뜀 |
low |
속도 우선. 단순한 작업은 생각 안 함 |
예를 들어 빠른 응답이 중요한 챗봇이라면 low로, 복잡한 의사결정이 필요하면 xhigh로 다이얼을 돌리시면 됩니다.
response = client.messages.create(
model="claude-opus-4-7",
max_tokens=16000,
thinking={"type": "adaptive"},
output_config={"effort": "low"}, # ← 빠른 응답이 중요할 때
messages=[{"role": "user", "content": "오늘 날씨 한 줄로"}],
)비용 관점에서는 max_tokens가 단단한 상한선, effort가 부드러운 안내선이라고 기억하시면 편합니다. 두 개를 함께 쓰면 “최대 이만큼만, 그 안에서도 이 정도 강도로” 라고 양쪽에서 조절할 수 있어요.
7. 한 마디 #
처음 보면 “추론 모드"니 “효력 수준"이니 단어가 낯설어 보이지만, 사실 적응형 사고는 한 줄짜리 옵션입니다. thinking={"type": "adaptive"} — 이거 하나만 추가하면 Claude가 알아서 깊이를 조절해줘요. 사람이 일일이 신경 쓰던 일을 모델에게 맡기는 거니까, 오히려 코드가 더 단순해집니다.
뭔가 안 되는 것 같다면 위 함정 1~3 중 하나일 가능성이 큽니다. 특히 함정 3 — 생각 과정이 안 보여도 안에서는 잘 돌아가고 있다는 점을 기억해주세요.
다음 시리즈에서는 적응형 사고와 함께 쓰면 강력한 짝꿍, Effort 파라미터의 세부 활용을 더 깊게 다뤄볼 예정입니다. 천천히 따라오세요. AI 처음 만나시는 분이라도, 한 줄씩 쌓아가다 보면 어느새 익숙해지실 거예요.
Claude API 공식 문서를 한국어로 풀어쓴 시리즈입니다. 원문 정확성이 가장 우선, 의역과 친근함은 그 위에서.