感想などは白金鉱業.FMのハッシュタグ #白金鉱業fm につぶやいてもらえるととても喜びます!
匿名でのお便りもgoogle formにてお待ちしております!
目次
00:27~:Lost in the Middle: How Language Models Use Long Contexts12:43~:Language Models are Realistic Tabular Data Generatorsshow notes
辻さんが紹介している論文:Lost in the Middle: How Language Models Use Long Contexts関連する情報が入力コンテキストの先頭または末尾にある場合に性能が最も高くなることが多く、長いコンテキストの途中で関連する情報にアクセスしなければならない場合に性能が著しく低下することがわかったさらに、入力コンテキストが長くなるにつれて、明示的に長いコンテキストを持つモデルであっても性能が大幅に低下する金さんが紹介している論文:Language Models are Realistic Tabular Data GeneratorsICLR 2023 posterにて選定された実際にKaggleのPlaygroundコンペ用のデータに使われているRegression with a Crab Age DatasetMake Synthetic Crab Age DataGReaTのPythonパッケージ