August 20, 2023

73.言語モデルは中間部分を見ていない？「Lost in the Middle」とテキストデータのaugmentation？「GReaT」の話

28 minutes

感想などは白金鉱業.FMのハッシュタグ #白金鉱業fm につぶやいてもらえるととても喜びます！

匿名でのお便りもgoogle formにてお待ちしております！

—

00:27～：Lost in the Middle: How Language Models Use Long Contexts

12:43～：Language Models are Realistic Tabular Data Generators

show notes

辻さんが紹介している論文：Lost in the Middle: How Language Models Use Long Contexts

関連する情報が入力コンテキストの先頭または末尾にある場合に性能が最も高くなることが多く、

長いコンテキストの途中で関連する情報にアクセスしなければならない場合に性能が著しく低下することがわかった

さらに、入力コンテキストが長くなるにつれて、明示的に長いコンテキストを持つモデルであっても性能が大幅に低下する

金さんが紹介している論文:Language Models are Realistic Tabular Data Generators

ICLR 2023 posterにて選定された

実際にKaggleのPlaygroundコンペ用のデータに使われている

Regression with a Crab Age Dataset

Make Synthetic Crab Age Data

GReaTのPythonパッケージ

...more

View all episodes

By 白金鉱業

August 20, 2023

73.言語モデルは中間部分を見ていない？「Lost in the Middle」とテキストデータのaugmentation？「GReaT」の話

28 minutes

感想などは白金鉱業.FMのハッシュタグ #白金鉱業fm につぶやいてもらえるととても喜びます！

匿名でのお便りもgoogle formにてお待ちしております！

—

00:27～：Lost in the Middle: How Language Models Use Long Contexts

12:43～：Language Models are Realistic Tabular Data Generators

show notes

辻さんが紹介している論文：Lost in the Middle: How Language Models Use Long Contexts

関連する情報が入力コンテキストの先頭または末尾にある場合に性能が最も高くなることが多く、

長いコンテキストの途中で関連する情報にアクセスしなければならない場合に性能が著しく低下することがわかった

さらに、入力コンテキストが長くなるにつれて、明示的に長いコンテキストを持つモデルであっても性能が大幅に低下する

金さんが紹介している論文:Language Models are Realistic Tabular Data Generators

ICLR 2023 posterにて選定された

実際にKaggleのPlaygroundコンペ用のデータに使われている

Regression with a Crab Age Dataset

Make Synthetic Crab Age Data

GReaTのPythonパッケージ

...more

More shows like 白金鉱業.FM

View all

Rebuild

51 Listeners

backspace.fm

12 Listeners

regonn&curry.fm - 最新の生成AI動向を週刊でお届け -

0 Listeners

歴史を面白く学ぶコテンラジオ（COTEN RADIO）

224 Listeners

PRESIDENT Online 音声版

17 Listeners

佐々木亮の宇宙ばなし

1 Listeners

ゆる言語学ラジオ

50 Listeners

ひまじんプログラマーの週末エンジニアリングレッスン

0 Listeners

ゆるコンピュータ科学ラジオ

17 Listeners

News Connect あなたと経済をつなぐ5分間 #ニュースコネクト

19 Listeners

安住紳一郎の日曜天国

144 Listeners

入山章栄の経営理論でイシューを語ろう/Business Insider Japan

2 Listeners

となりのデータ分析屋さん

0 Listeners

耳で学ぶAI、ロボシンク

0 Listeners

ながらAIラジオ

0 Listeners

Share 73.言語モデルは中間部分を見ていない？「Lost in the Middle」とテキストデータのaugmentation？「GReaT」の話

Sign up to save your podcasts

73.言語モデルは中間部分を見ていない？「Lost in the Middle」とテキストデータのaugmentation？「GReaT」の話

73.言語モデルは中間部分を見ていない？「Lost in the Middle」とテキストデータのaugmentation？「GReaT」の話