"AI 모델 벤치마크 및 성능 보고서 — 2026-05-30"
"Anthropic이 2026년 5월 29일 공개한 Claude Opus 4.8은 동적 워크플로우와 3배 저렴해진 고속 모드를 특징으로 합니다. 에이전트 벤치마크에서 GPT-5.5를 제쳤으며, DeepSWE 지표 등에서도 치열한 경쟁이 이어지고 있습니다. 2026년 5월 말 현재, 코딩은 Claude Opus 4.7, 에이전트 작업은 GPT-5.5, 추론은 Gemini 3.1이 각각 강세를 보이고 있습니다."



