February 16, 2022

Proximal Policy Optimization מה זה

Listen Later

34 minutes

כבר התרגלנו בעולם המשין לרנינג, ששום מודל לא שורד יותר משנה-שנתיים בתור ה

SOTA

עד שמגיעה גישה חדשה שטורפת את הקלפים.

לכן מעניין דווקא לדבר על

PPO

שנשאר הגישה הדומיננטי ב

Reinforcement learning

כבר חמש שנים, ולא נראה שהוא הולך לשום מקום.

נלמד על הבעיתיות של למידה רק עם גרדיאנט, ונדבר על מה זה "גרדיאנט טבעי"

...more

View all episodes

View all episodes

Download on the App Store

Download on the App Store

Get it on Google Play

ExplAInable

By Tamir Nave & Uri Goren

5

11 ratings

February 16, 2022

Proximal Policy Optimization מה זה

Listen Later

34 minutes

כבר התרגלנו בעולם המשין לרנינג, ששום מודל לא שורד יותר משנה-שנתיים בתור ה

SOTA

עד שמגיעה גישה חדשה שטורפת את הקלפים.

לכן מעניין דווקא לדבר על

PPO

שנשאר הגישה הדומיננטי ב

Reinforcement learning

כבר חמש שנים, ולא נראה שהוא הולך לשום מקום.

נלמד על הבעיתיות של למידה רק עם גרדיאנט, ונדבר על מה זה "גרדיאנט טבעי"

...more

More shows like ExplAInable

עושים חשבון Osim Heshbon by רשת עושים היסטוריה

עושים חשבון Osim Heshbon

23 Listeners

עושים היסטוריה עם רן לוי Osim Historia With Ran Levi by רשת עושים היסטוריה

עושים היסטוריה עם רן לוי Osim Historia With Ran Levi

163 Listeners

חיות כיס Hayot Kiss by כאן | Kan

חיות כיס Hayot Kiss

131 Listeners

הפודקאסט של גיא קצוביץ' by גיא קצוביץ'

הפודקאסט של גיא קצוביץ'

11 Listeners

עושים טכנולוגיה by רשת עושים היסטוריה

עושים טכנולוגיה

35 Listeners

מנועי הכסף by Calcalist כלכליסט

מנועי הכסף

37 Listeners

חצי שעה של השראה עם ערן גפן by חצי שעה של השראה עם ערן גפן

חצי שעה של השראה עם ערן גפן

11 Listeners

התשובה עם דורון פישלר Hatshuva With Doron Fishler by רשת עושים היסטוריה

התשובה עם דורון פישלר Hatshuva With Doron Fishler

206 Listeners

הצוללת by גלובס - Globes

הצוללת

23 Listeners

בזמן שעבדתם by mako מאקו

בזמן שעבדתם

91 Listeners

אחד ביום by N12

אחד ביום

306 Listeners

מפלגת המחשבות by Beit Avi Chai

מפלגת המחשבות

81 Listeners

המנגנון - The Mechanism by כאן | Kan

המנגנון - The Mechanism

13 Listeners

פשוט AI by Benny Farber

פשוט AI

14 Listeners

TrashTech (טראשטק) by עמרי ברק ויואב צוקר

TrashTech (טראשטק)

5 Listeners