Claude 가이드 #4: Extended Thinking — Claude가 답하기 전에 생각할 시간 주기

Claude 가이드 - 이 글은 시리즈의 일부입니다.

부분 : 이 글

부분 : Claude 가이드 #3: 토큰 미리 세기 — 보내기 전에 얼마인지 확인하기

부분 : Claude 가이드 #2: 배치 처리 — 급하지 않은 일은 50% 싸게

부분 : Claude 가이드 #1: Prompt Caching — 같은 자료 비용을 10%로 줄이는 잠깐 기억하기

이 글은 Claude API 공식 문서의 Extended Thinking 페이지를 정리한 글입니다. 원문: https://platform.claude.com/docs/en/build-with-claude/extended-thinking 마지막 확인: 2026-05-14

1. 한 줄 요약
#

복잡한 질문일수록 Claude가 답을 내기 전에 속으로 차근차근 따져보게 만드는 스위치입니다.

2. 무엇이고 왜 좋을까
#

Extended Thinking(확장 사고)은, 시험 문제를 풀 때 곧장 답을 쓰지 않고 연습장에 먼저 풀이 과정을 적어보는 것과 같습니다.

평소 Claude는 질문을 받으면 곧장 답을 시작합니다. 이건 대부분의 대화에선 충분히 좋아요. 그런데 수학 문제, 긴 글의 모순 찾기, 여러 조건을 다 따져야 하는 일정 짜기처럼 여러 단계를 머릿속으로 정리해야 답이 정확해지는 일에서는, 곧장 답을 시작하면 자잘한 실수가 생기기 쉽습니다.

이때 Extended Thinking을 켜두면, Claude가 답을 시작하기 전에 “음, 먼저 이걸 따져보고, 그다음 이걸 확인하자” 하는 식의 내적 풀이 과정을 먼저 만든 뒤에 최종 답을 내놓습니다. 응답 안에는 thinking 블록(생각 메모)과 text 블록(최종 답)이 차례로 들어 있습니다.

핵심 수치 하나만 기억해두세요. 최신 모델인 Claude Opus 4.7에서는 이 기능이 적응형(adaptive) 으로 바뀌어서, 질문 난이도에 따라 얼마나 깊게 생각할지 Claude가 알아서 조절합니다. 쉬운 질문엔 거의 생각하지 않고, 어려운 질문엔 길게 생각해요.

3. 이런 상황에서 써요
#

상황 1: 학생 — 강의 자료 속 모순 잡아내기
#

기말 시험 전에 강의 PDF 100쪽을 정리하고 있다고 해볼게요. “3주차 노트에선 A라고 했는데, 7주차에선 B라고 적혀 있어요. 둘 다 맞는 건가요?” 같은 질문은 Claude가 여러 곳을 비교해야 답이 나옵니다. 곧장 답하면 한쪽 입장에만 맞춰서 어물쩍 넘어가기 쉽지만, Extended Thinking을 켜두면 “두 부분을 각각 정리하고, 어떤 관점에서 다른지 짚어보자"라는 식으로 생각을 펴고 답을 줍니다. 시험 직전 헷갈리는 부분을 정리할 때 특히 든든해요.

상황 2: 직장인 — 사내 규정 확인하기
#

회사 휴가 규정을 보면서 “저는 입사 7개월차에 작년 출산휴가를 쓴 적이 있고, 다음 달에 결혼휴가를 쓰려는데 며칠까지 가능한가요?” 같은 질문을 던진다고 해볼게요. 이런 질문은 조건 여러 개(근속기간, 과거 사용 이력, 휴가 종류, 회사 정책)를 동시에 따져야 합니다. Extended Thinking을 켜두면 Claude가 “먼저 근속기간 기준을 확인하고, 다음으로 이미 쓴 휴가 영향을 보고…” 하는 식으로 차례차례 풀어서 답해요. 인사팀에 한 번 더 묻기 전에 본인이 먼저 정리하기 좋습니다.

상황 3: 일반인 — 책 한 권 깊이 있게 이해하기
#

읽고 있는 책에서 “저자가 1장에서 한 주장이 5장에서도 일관되나요? 만약 모순이 있다면 어디인가요?” 같은 질문을 하고 싶다고 해볼게요. 이건 줄거리 요약이 아니라 사유의 흐름을 따라가는 일입니다. 곧장 답하면 그럴싸한 한두 줄로 끝나기 쉽지만, Extended Thinking이 켜져 있으면 Claude가 각 장의 주장을 하나씩 꺼내 비교한 뒤에 결론을 줍니다. 독서 모임 발제를 준비할 때 도움이 많이 돼요.

4. 가볍게 시작하기
#

💻 개발 경험이 있으신가요? 아래 코드는 Python(파이썬, 가장 흔히 쓰는 프로그래밍 언어) 기준 가장 짧은 예시입니다. 비개발자라면 “이런 식으로 켜는구나” 정도만 보고 넘기셔도 좋습니다.

import anthropic

client = anthropic.Anthropic()

response = client.messages.create(
    model="claude-opus-4-7",
    max_tokens=4096,
    # ↓ 이 한 줄이 Extended Thinking 스위치
    thinking={"type": "adaptive"},
    messages=[{
        "role": "user",
        "content": "1071과 462의 최대공약수를 단계적으로 구해주세요."
    }]
)

# 응답 안에는 '생각 블록'과 '최종 답 블록'이 함께 들어 있습니다
for block in response.content:
    print(block.type, "→", getattr(block, "text", getattr(block, "thinking", "")))

thinking={"type": "adaptive"} 한 줄만 추가하면 끝입니다. 이렇게 보내면 Claude가 질문 난이도를 보고 알아서 깊이 생각할지 말지를 결정합니다. 응답에는 thinking 블록(중간 풀이)과 text 블록(최종 답)이 차례로 담겨 나와요. 보통은 최종 답만 보여주고, 생각 블록은 따로 표시하지 않아도 괜찮습니다.

5. 흔한 오해와 함정
#

⚠️ 함정 1: “켜두면 무조건 답이 좋아지는 거 아닌가요?”
#

아닙니다. “오늘 날씨 어때?“처럼 단순한 질문에까지 깊은 사고를 강요하면, 답이 늦어지기만 하고 품질은 거의 그대로입니다. 또 생각하는 데 쓴 단어(토큰: AI가 글자를 세는 단위)에도 요금이 붙기 때문에 비용도 늘어요. 다행히 최신 모델(Opus 4.7)은 adaptive(적응형) 모드라서 쉬운 질문엔 거의 생각하지 않고 넘어갑니다. “복잡한 추론이 필요한 일에만 켠다” 가 기본 원칙입니다.

⚠️ 함정 2: “Claude가 한참 조용하다가 답해요. 멈춘 건가요?”
#

멈춘 게 아닙니다. Extended Thinking이 켜져 있으면 Claude가 먼저 속으로 풀이를 적고 있는 중이에요. 채팅창에서 글자가 흐르듯 나오는 스트리밍 방식을 쓸 때, 생각이 길어지면 첫 답 글자가 늦게 도착하는 것처럼 느껴집니다. 답을 빨리 보고 싶다면 display: "omitted" 옵션을 줘서 생각 블록은 화면에 안 비추고 최종 답부터 흘러나오게 할 수 있어요.

⚠️ 함정 3: “대화 중간에 끄고 켜고 마음대로 해도 되나요?”
#

한 번의 답변(어시스턴트 턴) 중간에 끄거나 켜는 건 막혀 있습니다. Claude가 도구(예: 검색)를 쓰는 도중에 생각 모드를 바꾸면, API가 자동으로 그 요청에서는 생각을 끄거나 풀이를 지워버려요. 안전하게 쓰려면 새 질문을 시작할 때 한 번 정해두고, 그 답이 다 끝난 다음에 다음 질문에서 바꾸면 됩니다.

6. 한 단계 더 (관심 있는 분만)
#

🎯 여기까지 오신 분 환영합니다. 이 섹션은 더 깊이 알고 싶은 분을 위한 보너스입니다. 본문만 읽으셔도 충분합니다.

생각 블록을 화면에 안 보이게 하면서 최종 답을 더 빨리 받고 싶을 때 쓰는 옵션이 있어요. 자동화된 처리나, 사용자에게 풀이 과정을 굳이 보여주지 않을 때 유용합니다.

response = client.messages.create(
    model="claude-opus-4-7",
    max_tokens=4096,
    thinking={"type": "adaptive"},
    # ↓ 생각 과정은 숨기고, 최종 답 글자부터 먼저 흘러나오게
    display="omitted",
    messages=[{"role": "user", "content": "이번 분기 매출 추세를 분석해줘"}]
)

이렇게 두면 응답 속에 thinking 블록은 들어 있지만 내용은 비어 있고(signature라는 암호화된 자취만 남음), 사용자가 보는 화면에는 최종 답이 곧장 나타납니다. 단, 생각하는 데 쓴 토큰 요금은 그대로 청구된다는 점만 기억하세요. 숨기는 건 속도용이지 비용 절약용이 아닙니다.

또 하나 알아두면 좋은 점 — 도구 사용(웹 검색, 파일 읽기 등)과 함께 쓰면 Claude가 도구를 호출하기 전후로 각각 생각할 수 있습니다. “검색 결과를 보고 한 번 더 따져본 뒤 답하기” 같은 흐름이 가능해져서, 복잡한 조사 작업에서 답의 깊이가 눈에 띄게 좋아집니다.

7. 한 마디
#

처음 Extended Thinking을 켤 때는 “이거 그냥 켜두면 좋은 거 아냐?” 싶지만, 사실은 언제 켤지 고르는 감각이 더 중요한 기능이에요. 단순한 잡담엔 꺼두고, 머리 아픈 비교·분석·다단계 추론에서만 켜면 됩니다. 다행히 최신 모델은 알아서 조절해주니까, 일단 adaptive로 켜두고 써보세요.

답이 너무 늦거나 비용이 늘었다면, 위의 함정 1~3 중 하나일 가능성이 큽니다. 차분히 다시 보시면 거의 다 풀려요.

다음 글에서는 Claude 가이드 #5 — Streaming(스트리밍 응답) 으로 찾아옵니다. Claude의 답이 한 번에 뚝 떨어지는 대신, 채팅창에 글자가 흐르듯 나오게 만드는 방법을 함께 살펴볼게요.

Claude API 공식 문서를 한국어로 풀어쓴 시리즈입니다. 원문 정확성이 가장 우선, 의역과 친근함은 그 위에서.

작성자

성경재

홈랩, 셀프호스팅, AI/ML, 데이터 분석에 관심이 많습니다.

Claude 가이드 - 이 글은 시리즈의 일부입니다.

부분 : 이 글

부분 : Claude 가이드 #3: 토큰 미리 세기 — 보내기 전에 얼마인지 확인하기

부분 : Claude 가이드 #2: 배치 처리 — 급하지 않은 일은 50% 싸게

부분 : Claude 가이드 #1: Prompt Caching — 같은 자료 비용을 10%로 줄이는 잠깐 기억하기

1. 한 줄 요약 #

2. 무엇이고 왜 좋을까 #

3. 이런 상황에서 써요 #

상황 1: 학생 — 강의 자료 속 모순 잡아내기 #

상황 2: 직장인 — 사내 규정 확인하기 #

상황 3: 일반인 — 책 한 권 깊이 있게 이해하기 #

4. 가볍게 시작하기 #

5. 흔한 오해와 함정 #

⚠️ 함정 1: “켜두면 무조건 답이 좋아지는 거 아닌가요?” #

⚠️ 함정 2: “Claude가 한참 조용하다가 답해요. 멈춘 건가요?” #

⚠️ 함정 3: “대화 중간에 끄고 켜고 마음대로 해도 되나요?” #

6. 한 단계 더 (관심 있는 분만) #

7. 한 마디 #