Variabilis

Ep. 09: GPipe - Easy Scaling with Micro-Batch Pipeline Parallelism


Listen Later

Hoy vamos con GPipe, un paper que resolvió uno de los problemas más prácticos del deep learning: ¿Cómo entrenas modelos que son demasiado grandes para caber en una sola GPU? La respuesta: Pipeline parallelism con micro-batches. Suena técnico, pero es una idea elegante que permitió entrenar modelos de 6 mil millones de parámetros.

...more
View all episodesView all episodes
Download on the App Store

VariabilisBy Cápsulas de Inteligencia Artificial y Machine Learning