ExplAInable

על RLHF ומודלי שפה גדולים


Listen Later

בפרק זה החליפו מייק ותמיר את התובנות החידודים והשאלות הפתוחות שלהם בניסיון להבין איך מתחברים עולם ה RL ועולם ה LLM (קרי RLHF). ב 2024 השתנתה הפרדיגמה - בתחילה יצירת מודל reward כדי לעשות אימון נוסף ל LLM אחרי ה pretraining שלו באמצעות PPO. ולאחר מכן הוחלף ה PPO בRLHF.

בעוד רוב מודלי ה reasoning של החברות הגדולות (chatgpt, claude, gemini) עדיין באפילה - נדבר על איך לדעתנו RLHF יכול לשמש בתהליך.

...more
View all episodesView all episodes
Download on the App Store

ExplAInableBy Tamir Nave & Uri Goren

  • 5
  • 5
  • 5
  • 5
  • 5

5

1 ratings


More shows like ExplAInable

View all
עושים היסטוריה עם רן לוי Osim Historia With Ran Levi by רשת עושים היסטוריה

עושים היסטוריה עם רן לוי Osim Historia With Ran Levi

160 Listeners

גיקונומי by ראם שרמן ודורון ניר

גיקונומי

87 Listeners

עושים חשבון Osim Heshbon by רשת עושים היסטוריה

עושים חשבון Osim Heshbon

20 Listeners

חיות כיס Hayot Kiss by כאן | Kan

חיות כיס Hayot Kiss

141 Listeners

המשחק הגדול by ניצן דוד פוקס

המשחק הגדול

46 Listeners

הפודקאסט של גיא קצוביץ' by גיא קצוביץ'

הפודקאסט של גיא קצוביץ'

10 Listeners

עושים טכנולוגיה by רשת עושים היסטוריה

עושים טכנולוגיה

32 Listeners

מנועי הכסף by Calcalist כלכליסט

מנועי הכסף

35 Listeners

כסף בקיר by גלובס - Globes

כסף בקיר

16 Listeners

בזמן שעבדתם by mako מאקו

בזמן שעבדתם

95 Listeners

אחד ביום by N12

אחד ביום

290 Listeners

השקעות לעצלנים - פודקאסט על כסף, השקעות והחיים עצמם by תמיר מנדובסקי

השקעות לעצלנים - פודקאסט על כסף, השקעות והחיים עצמם

29 Listeners

המנגנון - The Mechanism by כאן | Kan

המנגנון - The Mechanism

17 Listeners

פשוט AI by Benny Farber

פשוט AI

12 Listeners

TrashTech (טראשטק) by עמרי ברק ויואב צוקר

TrashTech (טראשטק)

5 Listeners