Misreading Chat

#124: GAIA: a benchmark for General AI Assistants


Listen Later

LLM に解かせる難問集と採点結果を向井が睨みました。ご意見感想などは Reddit やおたより投書箱にお寄せください。iTunes のレビューや星もよろしくね。

  • [2311.12983] GAIA: a benchmark for General AI Assistants
  • gaia-benchmark/GAIA · Datasets at Hugging Face
  • ...more
    View all episodesView all episodes
    Download on the App Store

    Misreading ChatBy Hajime Morrita, Jun Mukai

    • 5
    • 5
    • 5
    • 5
    • 5

    5

    6 ratings


    More shows like Misreading Chat

    View all
    歴史を面白く学ぶコテンラジオ (COTEN RADIO) by COTEN inc.

    歴史を面白く学ぶコテンラジオ (COTEN RADIO)

    240 Listeners

    超相対性理論 by 超相対性理論

    超相対性理論

    17 Listeners

    ゆるコンピュータ科学ラジオ by ゆるコンピュータ科学ラジオ

    ゆるコンピュータ科学ラジオ

    21 Listeners

    リファクタリングとともに生きるラジオ by リファラジ

    リファクタリングとともに生きるラジオ

    0 Listeners

    日本一たのしい哲学ラジオ by 日本一たのしい哲学ラジオ

    日本一たのしい哲学ラジオ

    9 Listeners

    ぽこピーのゆめうつつ by POKOPEA

    ぽこピーのゆめうつつ

    5 Listeners