April 19, 2025

[115] על RLHF ומודלי שפה גדולים

Listen Later

55 minutes

בפרק זה החליפו מייק ותמיר את התובנות החידודים והשאלות הפתוחות שלהם בניסיון להבין איך מתחברים עולם ה RL ועולם ה LLM (קרי RLHF). ב 2024 השתנתה הפרדיגמה - בתחילה יצירת מודל reward כדי לעשות אימון נוסף ל LLM אחרי ה pretraining שלו באמצעות PPO. ולאחר מכן הוחלף ה PPO בRLHF.

בעוד רוב מודלי ה reasoning של החברות הגדולות (chatgpt, claude, gemini) עדיין באפילה - נדבר על איך לדעתנו RLHF יכול לשמש בתהליך.

...more

View all episodes

View all episodes

Download on the App Store

Download on the App Store

Get it on Google Play

ExplAInable

By Tamir Nave, Mike Erlihson, Uri Goren, Hila Paz Herszfang

5

11 ratings

April 19, 2025

[115] על RLHF ומודלי שפה גדולים

Listen Later

55 minutes

בפרק זה החליפו מייק ותמיר את התובנות החידודים והשאלות הפתוחות שלהם בניסיון להבין איך מתחברים עולם ה RL ועולם ה LLM (קרי RLHF). ב 2024 השתנתה הפרדיגמה - בתחילה יצירת מודל reward כדי לעשות אימון נוסף ל LLM אחרי ה pretraining שלו באמצעות PPO. ולאחר מכן הוחלף ה PPO בRLHF.

בעוד רוב מודלי ה reasoning של החברות הגדולות (chatgpt, claude, gemini) עדיין באפילה - נדבר על איך לדעתנו RLHF יכול לשמש בתהליך.

...more

More shows like ExplAInable

גיקונומי by ראם שרמן ודורון ניר

גיקונומי

92 Listeners

עושים היסטוריה עם רן לוי Osim Historia With Ran Levi by רשת עושים היסטוריה

עושים היסטוריה עם רן לוי Osim Historia With Ran Levi

163 Listeners

חיות כיס Hayot Kiss by כאן | Kan

חיות כיס Hayot Kiss

146 Listeners

מנועי הכסף by כלכליסט

מנועי הכסף

38 Listeners

האינטרסנטים by TheMarker

האינטרסנטים

82 Listeners

התשובה עם דורון פישלר Hatshuva With Doron Fishler by רשת עושים היסטוריה

התשובה עם דורון פישלר Hatshuva With Doron Fishler

185 Listeners

בזמן שעבדתם by mako מאקו

בזמן שעבדתם

105 Listeners

אחד ביום by N12

אחד ביום

317 Listeners

הכותרת by שרון כידון | Be.po

הכותרת

115 Listeners

מפלגת המחשבות by Beit Avi Chai

מפלגת המחשבות

97 Listeners

חוץ לארץ by הארץ

חוץ לארץ

83 Listeners

הפודקאסט של נדב פרי by All•in & Nadav Perry

הפודקאסט של נדב פרי

52 Listeners

השקעות לעצלנים - פודקאסט על כסף, השקעות והחיים עצמם by תמיר מנדובסקי

השקעות לעצלנים - פודקאסט על כסף, השקעות והחיים עצמם

29 Listeners

מיכה סטוקס מגיש: שוק ההון. בורסה. וול סטריט. השקעות. מסחר by מיכה סטוקס MICHA.STOCKS

מיכה סטוקס מגיש: שוק ההון. בורסה. וול סטריט. השקעות. מסחר

5 Listeners

הקרנף - עם יואב רבינוביץ׳ by בית הפודיום

הקרנף - עם יואב רבינוביץ׳

23 Listeners