목차
Claude 가이드 - 이 글은 시리즈의 일부입니다.
이 글은 Claude API 공식 문서의 PDF Support 페이지를 정리한 글입니다. 원문: https://platform.claude.com/docs/en/build-with-claude/pdf-support 마지막 확인: 2026-05-21
1. 한 줄 요약 #
PDF를 통째로 Claude에 넘기면, 글자뿐 아니라 표·그래프·이미지까지 한꺼번에 읽고 답해줍니다.
2. 무엇이고 왜 좋을까 #
PDF 지원 기능은 친구에게 책을 펼쳐 보여주며 “이 표 좀 같이 봐줄래?” 하고 묻는 것과 같습니다.
지금까지 PDF를 AI에 넘기려면 보통 이렇게 했습니다 — 파일을 열고, 본문을 복사하고, 표는 따로 옮겨 적고, 그림은 설명을 손으로 풀어 쓰고… 그러다 보면 정작 질문할 힘이 빠지죠. Claude의 PDF 지원은 이 모든 과정을 건너뛰게 해줍니다. 파일을 그대로 넘기면, Claude가 페이지마다 글자를 읽고 동시에 이미지로도 한 번 더 보는 방식으로 내용을 이해합니다. 표 안의 숫자, 차트의 추세선, 도식 안의 화살표까지 함께 살핍니다.
한 가지 핵심 수치 — 한 번 요청에 최대 600페이지, 32MB까지 보낼 수 있습니다. 웬만한 강의 자료, 보고서, 설명서 한 권 정도는 한 번에 들어간다고 보시면 됩니다.
3. 이런 상황에서 써요 #
상황 1: 강의자료 PDF 50장을 시험 전에 정리해야 하는 학생 #
학기말이 다가오면 책상이 PDF로 뒤덮입니다. 강의자료, 보충자료, 교수님이 올려주신 논문 요약본까지. 한 장씩 다시 읽기엔 시간이 없죠. PDF 한 묶음을 그대로 Claude에 넘기고 “8장에 나오는 그래프가 뭘 의미하는지 풀어줘"라고 물어보세요. 텍스트뿐 아니라 그래프의 축과 곡선까지 함께 읽고 설명해줍니다. 시험 전날 든든한 스터디 친구가 생기는 셈입니다.
상황 2: 100페이지짜리 사내 매뉴얼에서 답을 찾아야 하는 직장인 #
회사에는 꼭 한 권씩 있습니다 — 신입 때 받은 두꺼운 매뉴얼, 작년에 개정된 사내 정책집, 제품 사양서 PDF. “휴가 신청은 며칠 전까지 해야 하지?”, “이 부품의 최대 허용 온도가 얼마였더라?” 같은 질문이 떠오를 때마다 매뉴얼을 처음부터 뒤지긴 어렵습니다. PDF를 통째로 첨부하고 자연어로 물어보세요. 본문 안의 표·도면까지 함께 보고 답합니다.
상황 3: 두꺼운 책 한 권을 친구에게 추천하기 전 요약하고 싶은 일반인 #
좋은 책을 읽고 누군가에게 추천하고 싶을 때, “어떤 책이야?” 한 마디에 정리해서 답하기는 쉽지 않습니다. 책의 전자 PDF(혹은 합법적으로 다운로드 가능한 자료)를 첨부하고 “핵심 메시지 세 가지와, 책 중간에 나오는 그 도식이 뭘 말하는지 알려줘"라고 부탁해보세요. 본문과 그림을 함께 봐주는 독서 파트너가 됩니다.
4. 가볍게 시작하기 #
💻 개발 경험이 있으신가요? 아래 코드는 Python(파이썬, 가장 널리 쓰이는 프로그래밍 언어) 기준 가장 짧은 예시입니다. 비개발자라면 “PDF 한 줄 첨부하면 끝이구나” 정도로 보고 넘어가셔도 좋습니다. 실제로 일반 사용자는 Claude 앱이나 웹에서 파일을 업로드해 똑같은 일을 할 수 있습니다.
import anthropic
client = anthropic.Anthropic()
message = client.messages.create(
model="claude-opus-4-7",
max_tokens=1024,
messages=[
{
"role": "user",
"content": [
# ↓ 이 한 블록이 PDF 첨부의 핵심
{
"type": "document",
"source": {
"type": "url",
"url": "https://example.com/내자료.pdf",
},
},
{"type": "text", "text": "이 문서의 핵심 결론을 세 가지로 정리해줘."},
],
}
],
)
print(message.content)코드의 핵심은 가운데 document 블록 하나입니다. PDF가 인터넷 어딘가에 올라가 있다면 URL만 넘기면 끝납니다. 내 컴퓨터에 있는 파일이라면 base64(베이스64, 파일을 글자처럼 바꾸는 방식)로 변환해 넘기거나, Files API(파일을 한 번 올려두고 ID만 재사용하는 기능)를 쓰면 됩니다. 어느 방법이든 Claude는 페이지마다 글자와 이미지를 함께 읽어 답합니다.
5. 흔한 오해와 함정 #
⚠️ 함정 1: “용량 제한이 32MB라니까 큰 파일 그냥 다 넘기면 되겠지?” #
작아 보여도 사진이 많거나 글자가 빽빽한 PDF는 의외로 빨리 한도에 다다릅니다. Claude는 페이지마다 이미지로도 한 번 더 보기 때문에, 글자 수가 적어도 시각 정보가 많으면 토큰(AI가 글자를 세는 단위)을 많이 씁니다. 300페이지짜리 두꺼운 보고서라면 처음부터 챕터별로 나눠 넘기는 편이 안전합니다.
⚠️ 함정 2: “스캔한 PDF 넣었는데 글자가 흐려서 그런가, 답이 자꾸 이상해요” #
PDF가 종이를 스캔한 것이거나 글자가 또렷하지 않으면 Claude도 사람처럼 잘못 읽을 수 있습니다. 글자가 또렷하고, 페이지가 똑바로 서 있고, 일반적인 글꼴로 된 PDF일수록 정확도가 올라갑니다. 스캔본이라면 가능하면 OCR(오시아르, 이미지 속 글자를 텍스트로 바꾸는 기술)을 한 번 거친 PDF로 바꿔서 넘기세요.
⚠️ 함정 3: “같은 PDF로 질문 열 개 했는데 그때마다 새로 읽어야 해요?” #
기본 상태에서는 매번 처음부터 읽습니다. 같은 문서로 여러 질문을 이어서 할 거라면 프롬프트 캐싱(잠깐 기억해두기, 가이드 #9 참고)을 함께 켜두세요. 같은 PDF를 두 번째부터는 훨씬 싸게 읽어줍니다. 학생이 한 권의 책을 두고 시험 공부를 한다거나, 직장인이 같은 매뉴얼에 여러 질문을 한다면 거의 필수 조합입니다.
6. 한 단계 더 (관심 있는 분만) #
🎯 여기까지 오신 분 환영합니다. 이 섹션은 더 깊이 알고 싶은 분을 위한 보너스입니다. 본문만 읽으셔도 충분합니다.
같은 PDF에 질문을 여러 번 던질 예정이라면, PDF 첨부 블록 안에 cache_control 한 줄을 더해주는 것만으로 두 번째 요청부터 속도와 비용이 확 줄어듭니다.
message = client.messages.create(
model="claude-opus-4-7",
max_tokens=1024,
messages=[
{
"role": "user",
"content": [
{
"type": "document",
"source": {
"type": "base64",
"media_type": "application/pdf",
"data": pdf_data,
},
# ↓ 이 한 줄이 'PDF를 잠깐 기억해두기' 스위치
"cache_control": {"type": "ephemeral"},
},
{"type": "text", "text": "이 문서를 요약해줘."},
],
}
],
)비용 감각을 잡아보면 — PDF 한 페이지는 보통 1,5003,000 토큰을 씁니다. 50페이지 자료라면 한 번 읽는 데 대략 7만15만 토큰이 들 수 있다는 뜻이죠. 같은 자료에 질문을 다섯 번 더 한다면, 캐싱 없이는 그때마다 다시 그 비용이 들지만, 캐싱이 켜져 있으면 두 번째부터는 약 1/10 가격으로 떨어집니다. 두꺼운 자료를 두고 오래 대화할수록 효과가 큽니다.
7. 한 마디 #
PDF를 통째로 첨부한다는 것, 처음 들으면 “그게 정말 돼?” 싶지만 실제로는 파일 하나 끌어다 놓는 것만큼 간단합니다. 학생이라면 시험 공부를 함께해줄 친구로, 직장인이라면 매뉴얼 안에서 답을 찾아주는 동료로, 일반인이라면 두꺼운 책을 함께 읽어주는 독서 파트너로 써보세요.
혹시 답이 어딘가 이상하다면 십중팔구 함정 1~3 중 하나일 가능성이 큽니다 — 파일이 너무 크진 않은지, 스캔본이라 글자가 흐리진 않은지, 같은 PDF를 매번 새로 읽고 있진 않은지 살펴보시면 대부분 풀립니다.
다음 글에서는 Claude 가이드 #12 — 이미지·비전 입력 편으로 찾아옵니다. PDF가 문서를 통째로 읽는 기능이었다면, 다음 편은 사진 한 장을 보여주고 “이게 뭐야?“라고 물어보는 이야기입니다. 그때 또 뵙겠습니다.
Claude API 공식 문서를 한국어로 풀어쓴 시리즈입니다. 원문 정확성이 가장 우선, 의역과 친근함은 그 위에서.