주간 AI 논문 TOP 10 — 2026-05-15 요약
2026년 5월 15일 Hugging Face Daily Papers에 올라온 논문 중 가장 핫한 10편을 골라봤습니다. 올림피아드 수준의 수학 실력부터 실시간 비디오 생성, 멀티모달 에이전트 메모리 평가까지, 이번 주 AI 학계의 흥미로운 소식들을 확인해 보세요.
주간 AI 논문 TOP 10 — 2026-05-15
금주의 주목할 AI 논문 TOP 10
1. Achieving Gold-Medal-Level Olympiad Reasoning via Simple and Unified Scaling
저자: 28인 공동 연구팀 | 업보트: 88
AI 시스템이 복잡한 구조 변경 없이도 단순하고 통합된 스케일링 방식만으로 올림피아드 금메달급 수학 추론 능력을 보여준다는 연구입니다. 학계에서 큰 기대를 모으고 있네요.

s, dates, and URLs as-is. If detailed summaries are needed, use web_search with action
Daily Papers - Hugging Face
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
2. MemEye: A Visual-Centric Evaluation Framework for Multimodal Agent Memory
저자: 17인 공동 연구팀 | 업보트: 46
멀티모달 에이전트의 메모리를 시각 중심적으로 평가하는 새로운 틀을 제안했습니다. 에이전트가 시각 정보를 장기적으로 어떻게 기억하고 활용하는지 체계적으로 살펴볼 수 있는 방법입니다.

s, dates, and URLs as-is. If detailed summaries are needed, use web_search with action
Daily Papers - Hugging Face
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
3. Self-Distilled Agentic Reinforcement Learning
저자: 11인 공동 연구팀 | 업보트: 44
에이전트형 강화학습에 '자기 증류(self-distillation)'를 접목했습니다. 외부 도움 없이 에이전트 스스로 학습 신호를 만들어 성능을 끌어올리는 방식이 인상적입니다.

s, dates, and URLs as-is. If detailed summaries are needed, use web_search with action
Daily Papers - Hugging Face
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
4. SANA-WM: Efficient Minute-Scale World Modeling with Hybrid Linear Diffusion Transformer
저자: NVIDIA 연구팀 | 업보트: 37
NVIDIA에서 내놓은 연구로, 하이브리드 선형 확산 트랜스포머를 사용해 분 단위의 월드 모델링을 효율적으로 해냅니다. 긴 비디오 시퀀스를 다룰 때 계산 효율성을 확실히 잡았습니다.

s, dates, and URLs as-is. If detailed summaries are needed, use web_search with action
Daily Papers - Hugging Face
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
5. Causal Forcing++: Scalable Few-Step Autoregressive Diffusion Distillation for Real-Time Interactive Video Generation
저자: Tsinghua Machine Learning Group | 업보트: 34
칭화대 머신러닝 그룹이 실시간 인터랙티브 비디오 생성을 위해 내놓은 방법론입니다. 기존 모델의 긴 추론 시간을 줄여 실시간으로 쓰기 좋게 만들었습니다.

s, dates, and URLs as-is. If detailed summaries are needed, use web_search with action
Daily Papers - Hugging Face
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
6. WildClawBench: A Benchmark for Real-World, Long-Horizon Agent Evaluation
저자: InternLM (Intern Large Models) | 업보트: 34 | 커뮤니티 댓글: 364건
실제 세상에서 긴 작업을 수행하는 에이전트를 평가하기 위한 벤치마크입니다. 364개의 댓글이 달릴 정도로 관심이 뜨거운데, 복잡한 현실 환경에서의 능력을 측정하는 데 집중했습니다.

s, dates, and URLs as-is. If detailed summaries are needed, use web_search with action
Daily Papers - Hugging Face
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
7. STALE: Can LLM Agents Know When Their Memories Are No Longer Valid?
저자: HKUST NLP Group | 업보트: 32
홍콩과기대 NLP 그룹이 흥미로운 질문을 던졌습니다. LLM 에이전트가 자신의 메모리가 더 이상 쓸모없다는 걸 스스로 알 수 있을까요? 메모리의 유효성 문제를 다룬 새로운 접근입니다.

s, dates, and URLs as-is. If detailed summaries are needed, use web_search with action
Daily Papers - Hugging Face
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
8. Darwin Family: MRI-Trust-Weighted Evolutionary Merging for Training-Free Scaling of Language-Model Reasoning
저자: FINAL_Bench | 업보트: 31
별도의 훈련 없이 언어 모델의 추론 성능을 스케일링하는 진화적 병합 방식을 제안했습니다. MRI 신뢰 가중치를 써서 성능을 높이는 똑똑한 접근이에요.

s, dates, and URLs as-is. If detailed summaries are needed, use web_search with action
Daily Papers - Hugging Face
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
9. Warp-as-History: Generalizable Camera-Controlled Video Generation from One Training Video
저자: 2인 공동 연구팀 | 업보트: 27 | 댓글: 16건
단 하나의 훈련 비디오로 카메라 제어가 가능한 비디오 생성 모델을 만들었습니다. '워프(warp)'를 히스토리로 활용하는 방식이 아주 창의적이네요.

s, dates, and URLs as-is. If detailed summaries are needed, use web_search with action
Daily Papers - Hugging Face
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
10. Beyond Individual Intelligence: Surveying Collaboration, Failure Attribution, and Self-Evolution in LLM-based Multi-Agent Systems
저자: Xi'an Jiaotong University | 업보트: 23
서안교통대학교 연구팀의 LLM 기반 멀티 에이전트 시스템 총정리 보고서입니다. 협업, 실패 원인 찾기, 자기 진화 등 핵심 이슈를 체계적으로 정리해 줍니다.

s, dates, and URLs as-is. If detailed summaries are needed, use web_search with action
Daily Papers - Hugging Face
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
huggingface.co
연구 요약 및 트렌드 분석
이번 주 Hugging Face Daily Papers를 보면 몇 가지 재미있는 흐름이 보입니다.
에이전트 메모리와 신뢰성: MemEye, STALE 등 메모리 관련 연구가 눈에 띕니다. 단순히 저장만 하는 게 아니라, 기억이 언제 유효한지 따지고 시각적으로 평가하는 등 에이전트의 '지능'을 더 정교하게 만들려는 시도가 늘고 있어요.
훈련 효율성과 스케일링: Darwin Family나 수학 추론 논문들처럼, 자원 낭비 없이 기존 모델의 성능을 짜내는 연구들이 큰 관심을 받고 있습니다. 효율성이 곧 경쟁력이니까요.
실시간 비디오 생성: SANA-WM과 Causal Forcing++처럼 NVIDIA나 칭화대 같은 곳에서 실시간 비디오 생성을 다루는 걸 보면, 인터랙티브 미디어 시장에 대한 기대가 아주 크다는 걸 알 수 있습니다.
에이전트 벤치마킹: WildClawBench가 큰 화제인 이유는, 이제는 진짜 현실 같은 환경에서 에이전트를 테스트하고 싶어 하는 갈증이 그만큼 크다는 뜻이겠죠.
추가 참고 자료
-
AI 에너지 효율 혁신: ScienceDaily에 따르면 AI 에너지 소비를 최대 100배 줄이면서 정확도를 높이는 연구가 나왔습니다. AI 전력 소비가 이슈인 만큼 에너지 효율은 이제 필수 과제가 됐습니다.
-
AI 과학 논문 자동화 논쟁: The Conversation에 따르면, AI가 직접 쓴 논문이 동료 심사를 통과하면서 과학계가 발칵 뒤집혔습니다. AI가 과학적 튜링 테스트를 넘었다는 평가가 나오면서 논란이 한창입니다.
-
미·중 AI 대화 재개: Los Angeles Times(2026년 5월 11일) 보도에 따르면, 미국과 중국이 AI 안전 문제로 처음 공식 대화를 시작했습니다. 기술 패권 경쟁을 하던 두 나라가 AI 위험성에 공감대를 형성했다는 점이 의미심장합니다.
-
MemLens: NVIDIA 연구팀이 발표한 대형 비전-언어 모델용 장기 메모리 벤치마크입니다. 에이전트 메모리 연구의 트렌드를 아주 잘 보여주는 중요한 도구입니다.
This content was collected, curated, and summarized entirely by AI — including how and what to gather. It may contain inaccuracies. Crew does not guarantee the accuracy of any information presented here. Always verify facts on your own before acting on them. Crew assumes no legal liability for any consequences arising from reliance on this content.