fukabori.fm

107. LLMをゼロから作るということ w/ Takahiro Omi


Listen Later

ストックマークの近江さんをゲストに、大規模言語モデルをゼロから作る方法、学習のデータセット、モデルアーキテクチャ、学習環境への取り組みなどについて語っていただきました。

話したネタ

  • どのような大規模言語モデルと作ったのか?特徴は何か?
  • データセットに何を使ったのか?
  • 日本語と英語とのバランスは?
  • 最終的なToken数は?
  • 事前学習モデルを作りたいとして、何から考えるのか?
  • ノイズのクリーニングと、その方法
  • 今回活用したモデルアーキテクチャ(Llama)
  • 前回のアーキテクチャは GPT-NeoX
  • 今回の学習環境は?
  • AWS Trainum 32コア x 16ノード
  • 学習にかかった時間は?
  • 学習時に大変だったこと・上手くいかなかったことは?
  • 学習中のチェックポイントとは何か?
  • なぜ、Token生成が速いのか?
  • 手元でLLMを動かすときの一番のネックは?
  • bit数を落とすFineTuning
  • Tokenizerとは何か?
  • 日本語の単語区切りはどのように考えるのか?
  • 今回のLLM作成のTokenizerは何を使ったのか?
  • ビジネスドメインでのLLM評価
  • ストックマーク株式会社のRecruitページ


See Privacy Policy at https://art19.com/privacy and California Privacy Notice at https://art19.com/privacy#do-not-sell-my-info.

...more
View all episodesView all episodes
Download on the App Store

fukabori.fmBy iwashi

  • 5
  • 5
  • 5
  • 5
  • 5

5

2 ratings


More shows like fukabori.fm

View all
Rebuild by Tatsuhiko Miyagawa

Rebuild

52 Listeners

backspace.fm by backspace.fm

backspace.fm

13 Listeners

楽しいラジオ「ドングリFM」 by donguri.fm

楽しいラジオ「ドングリFM」

6 Listeners

Misreading Chat by Hajime Morrita, Jun Mukai

Misreading Chat

6 Listeners

EM . FM #EMFM by EM.FM

EM . FM #EMFM

0 Listeners

Off Topic // オフトピック by Off Topic

Off Topic // オフトピック

16 Listeners

ガジェタッチ by リンクマン/弓月ひろみ

ガジェタッチ

3 Listeners

ゆる言語学ラジオ by Yuru Gengogaku Radio

ゆる言語学ラジオ

51 Listeners

ひまじんプログラマーの週末エンジニアリングレッスン by ひまじんプログラマー

ひまじんプログラマーの週末エンジニアリングレッスン

0 Listeners

ゆるコンピュータ科学ラジオ by ゆるコンピュータ科学ラジオ

ゆるコンピュータ科学ラジオ

12 Listeners

Qiita FM-エンジニアのキャリアを深掘り- by Qiita

Qiita FM-エンジニアのキャリアを深掘り-

0 Listeners

Podcast by Yuka Studio // ユカスタポッドキャスト by Podcast by Yuka Studio

Podcast by Yuka Studio // ユカスタポッドキャスト

3 Listeners

となりのデータ分析屋さん by 佐々木亮とたっちゃん

となりのデータ分析屋さん

0 Listeners

耳で学ぶAI、ロボシンク by 矢野 哲平

耳で学ぶAI、ロボシンク

1 Listeners

ながらAIラジオ by usutaku/gomichan

ながらAIラジオ

1 Listeners