본문으로 건너뛰기
CodeBerry

평가무결성

#ai-news

Anthropic 엔지니어링 블로그 #20: Eval Awareness — Claude가 자기가 평가받고 있다는 걸 알아챈 사건

2026년 5월 8일 · 4분 읽기 · #Eval Awareness #Benchmark
💬 -