↓ 본문으로 건너뛰기

AI 뉴스

2026

Anthropic 엔지니어링 블로그 #24: An Update on Recent Claude Code Quality Reports — 또 세 가지 버그가 겹쳤다

2026년 5월 8일 · 4분 읽기 · #Postmortem #Claude Code

Anthropic 엔지니어링 블로그 #23: Scaling Managed Agents — 뇌(harness)와 손(sandbox)을 분리하다

2026년 5월 8일 · 4분 읽기 · #Managed Agents #Architecture

Anthropic 엔지니어링 블로그 #22: Claude Code Auto Mode — 권한 팝업과 '위험한 다 허용' 사이의 중간

2026년 5월 8일 · 4분 읽기 · #Claude Code #Auto Mode

Anthropic 엔지니어링 블로그 #21: Harness Design for Long-Running App Development — 생성자·평가자를 따로 두니 6시간짜리 앱이 나왔다

2026년 5월 8일 · 4분 읽기 · #Long-Running Agent #Multi-Agent

Anthropic 엔지니어링 블로그 #20: Eval Awareness — Claude가 자기가 평가받고 있다는 걸 알아챈 사건

2026년 5월 8일 · 4분 읽기 · #Eval Awareness #Benchmark

Anthropic 엔지니어링 블로그 #19: Infrastructure Noise in Agentic Coding Evals — 벤치마크 점수, 그거 진짜 모델 차이인가요?

2026년 5월 8일 · 4분 읽기 · #Evaluation #Benchmark

Anthropic 엔지니어링 블로그 #18: Building a C Compiler with Parallel Claudes — 16명의 Claude가 2주간 자율로 만든 컴파일러

2026년 5월 8일 · 4분 읽기 · #Multi-Agent #Compiler

Anthropic 엔지니어링 블로그 #17: AI-Resistant Technical Evaluations — AI가 못 푸는 기술 면접 문제 만들기

2026년 5월 8일 · 4분 읽기 · #Evaluation #Anthropic

Anthropic 엔지니어링 블로그 #16: Demystifying Evals for AI Agents — 에이전트 평가, 무엇을 어떻게 재나

2026년 5월 8일 · 4분 읽기 · #Evals #Agent

Anthropic 엔지니어링 블로그 #15: Effective Harnesses for Long-Running Agents — 며칠짜리 작업을 위한 '교대 인수인계' 구조

2026년 5월 8일 · 3분 읽기 · #Long-Running Agent #Harness

1
2
3
→