
Sign up to save your podcasts
Or


En el episodio 11 cubrimos "Attention is All You Need" — el paper que introdujo los Transformers y que está detrás de GPT, BERT, Claude y prácticamente todo el AI moderno. Era denso, matemático, lleno de ecuaciones. Mucha gente lo leyó, asintió solemnemente... y no lo entendió del todo.
En 2018, Sasha Rush de Harvard NLP publicó The Annotated Transformer: una reimplementación línea por línea del paper, con cada ecuación acompañada de su código PyTorch correspondiente y comentarios que explican el por qué de cada decisión. Y de repente, todo hizo clic.
Este recurso no propone ideas nuevas — su contribución es otra: demostrar que reimplementar un paper es la forma más honesta de entenderlo.
By Cápsulas de Inteligencia Artificial y Machine LearningEn el episodio 11 cubrimos "Attention is All You Need" — el paper que introdujo los Transformers y que está detrás de GPT, BERT, Claude y prácticamente todo el AI moderno. Era denso, matemático, lleno de ecuaciones. Mucha gente lo leyó, asintió solemnemente... y no lo entendió del todo.
En 2018, Sasha Rush de Harvard NLP publicó The Annotated Transformer: una reimplementación línea por línea del paper, con cada ecuación acompañada de su código PyTorch correspondiente y comentarios que explican el por qué de cada decisión. Y de repente, todo hizo clic.
Este recurso no propone ideas nuevas — su contribución es otra: demostrar que reimplementar un paper es la forma más honesta de entenderlo.