목차
Claude 가이드 - 이 글은 시리즈의 일부입니다.
이 글은 Claude API 공식 문서의 Count tokens in a Message 페이지를 정리한 글입니다. 원문: https://platform.claude.com/docs/en/api/messages-count-tokens 마지막 확인: 2026-05-13
1. 한 줄 요약 #
Claude에게 질문을 보내기 전에, 이번 요청이 토큰을 몇 개 쓰는지 미리 세어볼 수 있습니다. 비용도, 길이도 미리 안심하고 확인하는 방법입니다.
2. 무엇이고 왜 좋을까 #
마트 계산대에서 결제 전에 영수증을 미리 보는 것과 같습니다.
Claude는 글자를 토큰(token, AI가 글자를 세는 단위) 이라는 작은 조각으로 나눠서 처리합니다. 한국어는 보통 한 글자가 1~2 토큰 정도, 영어는 단어 하나가 1 토큰 안팎이에요. 그런데 우리는 글을 쓸 때 “이게 몇 토큰일까?“를 감으로 알기가 어렵습니다. 긴 PDF 하나가 5만 토큰일 수도, 50만 토큰일 수도 있죠.
Count Tokens(토큰 세기) API는 실제로 답변을 받기 전에, “이 요청 보내면 입력 토큰 ○○개입니다"라고 미리 알려주는 가벼운 도구입니다. 응답을 생성하지 않으니 별도 과금 없이 무료로 호출할 수 있고, 결과도 거의 즉시 돌아옵니다.
비용이 걱정되거나, 모델의 입력 한도(예: 20만 토큰)를 넘기지 않으려 할 때 가장 먼저 떠올리면 좋은 친구입니다.
3. 이런 상황에서 써요 #
상황 1: 강의 PDF 50장을 통째로 넣어도 될까 (학생) #
기말고사 준비 중인 대학생. 교수님이 올려주신 강의자료 PDF 50장을 Claude에 통째로 넣고 “핵심만 정리해줘"라고 묻고 싶습니다. 그런데 이게 모델 한도 안에 들어가는지, 비용은 얼마나 나올지 감이 안 잡혀요.
이럴 때 먼저 토큰 세기를 한 번 돌려보면 “아, 12만 토큰이네. 한도(20만) 안이고 비용도 감당 가능하겠다” 하고 안심한 다음 본 질문을 보낼 수 있습니다. 반대로 25만 토큰이 나왔다면, 자료를 절반으로 나눠 두 번에 걸쳐 물어보는 식으로 계획을 세울 수 있어요.
상황 2: 사내 매뉴얼 챗봇 만들기 전 점검 (직장인) #
회사 인사팀에서 일하는 분이 사내 규정집(100페이지)을 Claude에 넣고 “직원들이 휴가 관련해서 자주 묻는 질문에 답하게” 하고 싶습니다. 매번 같은 매뉴얼이 입력으로 들어갈 텐데, 한 번 호출당 토큰이 얼마인지 알아야 한 달 비용을 머릿속으로 계산할 수 있죠.
토큰 세기를 한 번 돌려보면 “이 매뉴얼은 8만 토큰이고, 직원 질문이 평균 100토큰 정도니까 합쳐서 8만 토큰 조금 넘는 입력이구나"가 보입니다. 그러면 하루에 몇 번 정도 써도 되는지 감이 잡히고, 비용이 부담되면 다음 가이드(#4 프롬프트 캐싱)로 자연스럽게 넘어갈 수 있어요.
상황 3: 책 한 권 요약 시리즈 만들기 (일반인) #
좋아하는 자기계발서 한 권을 통째로 Claude에 넣고, “각 챕터를 3줄로 요약해줘”, “저자의 핵심 주장을 표로 정리해줘"처럼 여러 각도로 질문하고 싶은 일반 독자. 책 한 권을 넣을 수 있을지부터 궁금하죠.
토큰 세기를 먼저 호출해보면 “이 책은 15만 토큰이라 한 번에 들어가는구나” 하고 확인할 수 있습니다. 만약 한도를 넘으면 “그러면 13장만 먼저 넣고, 다음 번에 46장을 넣자"라고 분할 계획을 세울 수 있어요. 답변을 받지 않고 길이만 보는 것이라 시도 자체에 비용이 들지 않습니다.
4. 가볍게 시작하기 #
💻 개발 경험이 있으신가요? 아래 코드는 Python 기준 가장 짧은 예시입니다. 비개발자라면 “아, 이런 식으로 미리 확인하는구나” 정도로 보고 넘어가셔도 좋습니다.
import anthropic
client = anthropic.Anthropic()
# 답변을 받지 않고, 토큰 개수만 미리 세어봅니다
result = client.messages.count_tokens(
model="claude-opus-4-7",
messages=[
{"role": "user", "content": "안녕, Claude! 오늘 날씨 어때?"}
],
)
print(result.input_tokens) # 예: 18위 코드는 “이 질문을 실제로 보내면 입력 토큰이 몇 개일까?“만 물어보는 호출입니다. messages.create(실제 답변 받기)와 모양은 거의 같지만, 답변이 생성되지 않고 숫자만 돌아오기 때문에 응답 비용이 발생하지 않아요. PDF나 긴 문서를 넣어볼 때 특히 마음 편하게 쓸 수 있습니다.
5. 흔한 오해와 함정 #
⚠️ 함정 1: “토큰 = 글자 수 아닌가요?” #
가장 흔한 오해입니다. 토큰은 글자 수도, 단어 수도 아닙니다. AI가 글을 잘게 자른 조각의 개수예요. 한국어는 한 글자가 보통 1~2 토큰, 영어는 한 단어가 약 1 토큰. 그래서 “1000자니까 1000 토큰이겠지” 하고 짐작하면 거의 빗나갑니다. 궁금하면 짐작하지 말고 한 번 세어보세요. 그게 이 기능이 존재하는 이유입니다.
⚠️ 함정 2: “답변 토큰도 미리 알 수 있죠?” #
❌ 안 됩니다. Count Tokens는 입력 토큰만 알려줍니다. Claude가 얼마나 길게 답할지는 실제로 답해봐야 알 수 있어요. 다만 답변 길이는 우리가 max_tokens(최대 답변 길이)로 상한을 정할 수 있으니, “입력 + 최대 답변"을 합쳐서 최악의 경우 비용을 미리 계산하는 식으로 활용하면 됩니다.
⚠️ 함정 3: “토큰 미리 세는 것도 돈 들죠?” #
아니요. Count Tokens 호출 자체는 별도 과금이 없습니다. 실제 답변을 생성하지 않기 때문이에요. 그래서 PDF나 긴 자료를 넣기 전에 “이거 진짜 들어갈까?“를 부담 없이 여러 번 시도해볼 수 있습니다. 단, 너무 빠른 시간에 너무 자주 호출하면 호출 빈도 제한(rate limit, 시간당 요청 횟수 제한)에 걸릴 수 있으니 그것만 유의하세요.
6. 한 단계 더 (관심 있는 분만) #
🎯 여기까지 오신 분 환영합니다. 이 섹션은 더 깊이 알고 싶은 분을 위한 보너스입니다. 본문만 읽으셔도 충분합니다.
토큰 세기는 “이번 호출이 얼마일까?“를 가늠하는 출발점입니다. 입력 토큰 수만 알면 대략적인 비용을 곱셈 한 번으로 추정할 수 있어요. 예를 들어 어떤 모델이 100만 입력 토큰당 $3이라면:
| 입력 길이 | 입력 토큰 추정 | 입력 비용 추정 |
|---|---|---|
| 짧은 질문 1줄 | 약 20 | $0.00006 |
| A4 1장 분량 자료 | 약 700 | $0.0021 |
| PDF 30장 분량 | 약 3만 | $0.09 |
| 책 한 권 분량 | 약 15만 | $0.45 |
이런 표는 “한 번 부르는 데 얼마"가 아니라 “한 달에 1000번 부르면 얼마"로 곱해보면 감이 옵니다. 만약 같은 매뉴얼을 매번 넣어 비용이 부담된다면, 다음 글에서 만날 프롬프트 캐싱(같은 자료를 한 번만 보내고 다음부터는 10% 가격에 재사용)이 자연스러운 다음 단계입니다.
조금 더 정교하게 쓰고 싶다면, 시스템 메시지(역할 지시)와 사용자 메시지를 함께 넘겨서 실제 호출과 똑같은 조건으로 토큰을 세어볼 수도 있어요.
# 시스템 메시지까지 포함해서 진짜 호출과 똑같이 미리 세어보기
result = client.messages.count_tokens(
model="claude-opus-4-7",
system="당신은 친절한 한국어 도우미입니다.",
messages=[
{"role": "user", "content": "(여기에 긴 PDF 텍스트를 붙여넣기)"}
],
)
print(f"입력 토큰: {result.input_tokens}개")이렇게 하면 실제로 보낼 요청과 똑같은 조건의 토큰 수를 확인할 수 있어서, 비용 추정이 한층 정확해집니다.
7. 한 마디 #
처음엔 “토큰? 그게 뭐지?” 싶지만, 한 번 세어보고 나면 “아, 이 정도 길이는 이만큼이구나” 감이 빠르게 잡힙니다. AI에게 큰 자료를 보낼 때 막연한 걱정이 가장 큰 진입 장벽인데, 이 기능 하나로 그 걱정의 절반은 사라져요.
혹시 결과 숫자가 예상보다 크거나 작아도 놀라지 마세요. 위 함정 1~3 중 하나일 가능성이 높습니다. 한국어는 영어보다 토큰이 좀 더 나오고, 답변 길이는 따로 계산해야 한다는 것만 기억하시면 됩니다.
다음 글에서는 Claude 가이드 #4 — 프롬프트 캐싱을 소개합니다. 같은 자료를 매번 다시 보내지 않고, 한 번 기억시켜 두고 10% 가격에 재사용하는 방법이에요. 이번 글에서 토큰 비용을 알아봤다면, 다음 글에서는 그 비용을 줄이는 방법을 만나보실 수 있습니다.
Claude API 공식 문서를 한국어로 풀어쓴 시리즈입니다. 원문 정확성이 가장 우선, 의역과 친근함은 그 위에서.
— 키스 드림