
Sign up to save your podcasts
Or
최근 발표된 ‘리더보드 환상(The Leaderboard Illusion)’ 연구를 통해 Chatbot Arena와 같은 AI 벤치마크의 문제점과 Meta의 Llama 4 사례를 살펴보고, AI 모델 평가의 미래 방향성에 대해 논의합니다.
최근 발표된 ‘리더보드 환상(The Leaderboard Illusion)’ 연구를 통해 Chatbot Arena와 같은 AI 벤치마크의 문제점과 Meta의 Llama 4 사례를 살펴보고, AI 모델 평가의 미래 방향성에 대해 논의합니다.