AI 뉴스
2026
#ai-news
Anthropic 엔지니어링 블로그 #24: An Update on Recent Claude Code Quality Reports — 또 세 가지 버그가 겹쳤다
💬 -
#ai-news
Anthropic 엔지니어링 블로그 #23: Scaling Managed Agents — 뇌(harness)와 손(sandbox)을 분리하다
💬 -
#ai-news
Anthropic 엔지니어링 블로그 #22: Claude Code Auto Mode — 권한 팝업과 '위험한 다 허용' 사이의 중간
💬 -
#ai-news
Anthropic 엔지니어링 블로그 #21: Harness Design for Long-Running App Development — 생성자·평가자를 따로 두니 6시간짜리 앱이 나왔다
💬 -
#ai-news
Anthropic 엔지니어링 블로그 #20: Eval Awareness — Claude가 자기가 평가받고 있다는 걸 알아챈 사건
💬 -
#ai-news
Anthropic 엔지니어링 블로그 #19: Infrastructure Noise in Agentic Coding Evals — 벤치마크 점수, 그거 진짜 모델 차이인가요?
💬 -
#ai-news
Anthropic 엔지니어링 블로그 #18: Building a C Compiler with Parallel Claudes — 16명의 Claude가 2주간 자율로 만든 컴파일러
💬 -
#ai-news
Anthropic 엔지니어링 블로그 #17: AI-Resistant Technical Evaluations — AI가 못 푸는 기술 면접 문제 만들기
💬 -
#ai-news
Anthropic 엔지니어링 블로그 #16: Demystifying Evals for AI Agents — 에이전트 평가, 무엇을 어떻게 재나
💬 -
#ai-news
Anthropic 엔지니어링 블로그 #15: Effective Harnesses for Long-Running Agents — 며칠짜리 작업을 위한 '교대 인수인계' 구조
💬 -