April 19, 2025

על RLHF ומודלי שפה גדולים

Listen Later

55 minutes

בפרק זה החליפו מייק ותמיר את התובנות החידודים והשאלות הפתוחות שלהם בניסיון להבין איך מתחברים עולם ה RL ועולם ה LLM (קרי RLHF). ב 2024 השתנתה הפרדיגמה - בתחילה יצירת מודל reward כדי לעשות אימון נוסף ל LLM אחרי ה pretraining שלו באמצעות PPO. ולאחר מכן הוחלף ה PPO בRLHF.

בעוד רוב מודלי ה reasoning של החברות הגדולות (chatgpt, claude, gemini) עדיין באפילה - נדבר על איך לדעתנו RLHF יכול לשמש בתהליך.

...more

View all episodes

View all episodes

Download on the App Store

Download on the App Store

Get it on Google Play

ExplAInable

By Tamir Nave & Uri Goren

5

11 ratings

April 19, 2025

על RLHF ומודלי שפה גדולים

Listen Later

55 minutes

בפרק זה החליפו מייק ותמיר את התובנות החידודים והשאלות הפתוחות שלהם בניסיון להבין איך מתחברים עולם ה RL ועולם ה LLM (קרי RLHF). ב 2024 השתנתה הפרדיגמה - בתחילה יצירת מודל reward כדי לעשות אימון נוסף ל LLM אחרי ה pretraining שלו באמצעות PPO. ולאחר מכן הוחלף ה PPO בRLHF.

בעוד רוב מודלי ה reasoning של החברות הגדולות (chatgpt, claude, gemini) עדיין באפילה - נדבר על איך לדעתנו RLHF יכול לשמש בתהליך.

...more

More shows like ExplAInable

עושים חשבון Osim Heshbon by רשת עושים היסטוריה

עושים חשבון Osim Heshbon

24 Listeners

עושים היסטוריה עם רן לוי Osim Historia With Ran Levi by רשת עושים היסטוריה

עושים היסטוריה עם רן לוי Osim Historia With Ran Levi

164 Listeners

חיות כיס Hayot Kiss by כאן | Kan

חיות כיס Hayot Kiss

129 Listeners

הפודקאסט של גיא קצוביץ' by גיא קצוביץ'

הפודקאסט של גיא קצוביץ'

11 Listeners

עושים טכנולוגיה by רשת עושים היסטוריה

עושים טכנולוגיה

35 Listeners

מנועי הכסף by Calcalist כלכליסט

מנועי הכסף

37 Listeners

חצי שעה של השראה עם ערן גפן by חצי שעה של השראה עם ערן גפן

חצי שעה של השראה עם ערן גפן

11 Listeners

התשובה עם דורון פישלר Hatshuva With Doron Fishler by רשת עושים היסטוריה

התשובה עם דורון פישלר Hatshuva With Doron Fishler

205 Listeners

הצוללת by גלובס - Globes

הצוללת

23 Listeners

בזמן שעבדתם by mako מאקו

בזמן שעבדתם

91 Listeners

אחד ביום by N12

אחד ביום

306 Listeners

מפלגת המחשבות by Beit Avi Chai

מפלגת המחשבות

81 Listeners

המנגנון - The Mechanism by כאן | Kan

המנגנון - The Mechanism

14 Listeners

פשוט AI by Benny Farber

פשוט AI

13 Listeners

TrashTech (טראשטק) by עמרי ברק ויואב צוקר

TrashTech (טראשטק)

5 Listeners