Misreading Chat

#124: GAIA: a benchmark for General AI Assistants


Listen Later

LLM に解かせる難問集と採点結果を向井が睨みました。ご意見感想などは Reddit やおたより投書箱にお寄せください。iTunes のレビューや星もよろしくね。

  • [2311.12983] GAIA: a benchmark for General AI Assistants
  • gaia-benchmark/GAIA · Datasets at Hugging Face
  • ...more
    View all episodesView all episodes
    Download on the App Store

    Misreading ChatBy Hajime Morrita, Jun Mukai

    • 5
    • 5
    • 5
    • 5
    • 5

    5

    6 ratings


    More shows like Misreading Chat

    View all
    Rebuild by Tatsuhiko Miyagawa

    Rebuild

    49 Listeners

    耳で学ぶAI、ロボシンク by 矢野 哲平

    耳で学ぶAI、ロボシンク

    0 Listeners