April 18, 2024

#80- Layer pruning e Mixture of Depths.

Listen Later

15 minutes

Fala galera, continuando a serie de episódios sobre PEFT, nesse episoódio eu falo sobre tecnicas de otimização de inferência em LLMs.

Eu falo de layer pruning, onde a gente corta algumas camadas consecutivas da rede sem perder quase nada de qualidade do modelo.

Eu falo também sobre Mixture of Depths, uma tecnica semelhante ao Mixture of Experts, onde a gente usa um routing pra escolher quais tokens vão ser processados em qual camada da rede.

Paper MoD: https://arxiv.org/pdf/2404.02258.pdf

Paper layer pruning: https://arxiv.org/pdf/2403.17887v1.pdf

Instagram do podcast: https://www.instagram.com/podcast.lifewithai

Linkedin do podcast: https://www.linkedin.com/company/life-with-ai

...more

View all episodes

View all episodes

Download on the App Store

Download on the App Store

Get it on Google Play

Vida com IA

By Filipe Lauar

April 18, 2024

#80- Layer pruning e Mixture of Depths.

Listen Later

15 minutes

Fala galera, continuando a serie de episódios sobre PEFT, nesse episoódio eu falo sobre tecnicas de otimização de inferência em LLMs.

Eu falo de layer pruning, onde a gente corta algumas camadas consecutivas da rede sem perder quase nada de qualidade do modelo.

Eu falo também sobre Mixture of Depths, uma tecnica semelhante ao Mixture of Experts, onde a gente usa um routing pra escolher quais tokens vão ser processados em qual camada da rede.

Paper MoD: https://arxiv.org/pdf/2404.02258.pdf

Paper layer pruning: https://arxiv.org/pdf/2403.17887v1.pdf

Instagram do podcast: https://www.instagram.com/podcast.lifewithai

Linkedin do podcast: https://www.linkedin.com/company/life-with-ai

...more

More shows like Vida com IA

Braincast by B9

Braincast

108 Listeners

MacMagazine no Ar by MacMagazine.com.br

MacMagazine no Ar

179 Listeners

Giro do Loop by Loop Infinito

Giro do Loop

91 Listeners

Tecnocast by Tecnoblog

Tecnocast

42 Listeners

NerdCast by Jovem Nerd

NerdCast

1,010 Listeners

Naruhodo by B9, Naruhodo, Ken Fujioka, Altay de Souza

Naruhodo

120 Listeners

Petit Journal by Petit Journal

Petit Journal

78 Listeners

Economia Falada by Ricardo Amorim

Economia Falada

17 Listeners

Do Zero ao Topo by InfoMoney

Do Zero ao Topo

34 Listeners

O Assunto by G1

O Assunto

172 Listeners

Podcasts do Clóvis by Clóvis de Barros

Podcasts do Clóvis

32 Listeners

G4 Podcasts by G4 Educação

G4 Podcasts

7 Listeners

BBC Lê by BBC Brasil

BBC Lê

16 Listeners

the news ☕️ by waffle 🧇

the news ☕️

1 Listeners

IA Sob Controle - Inteligência Artificial by Alura - Hipsters Network

IA Sob Controle - Inteligência Artificial

1 Listeners