Podcast DevExpert

¿Cómo funciona Deepseek? Las bases de la IA explicadas | DevExpert 1x03


Listen Later

⚠️ ¿Quieres que ninguna IA te quite el trabajo? Entonces necesitas ir más allá con tus conocimientos sobre desarrollo de software.

🎁 Te regalo esta masterclass de 15 minutos donde te cuento todos los detalles 👉 https://devexpert.io/masterclass-15?utm_source=yt&utm_medium=social&utm_campaign=103

---

En este episodio detallado y exhaustivo, profundizamos en la atmósfera actual que rodea a los modelos de lenguaje, centrándonos en el desarrollo chino Deepseek. 

Exploramos qué es un modelo de lenguaje, cómo estos modelos integran la censura, la arquitectura y el funcionamiento detrás de las redes neuronales, el concepto de modelos open-source y el proceso de fine-tuning. 

Además, discutimos las diferencias entre los modelos razonadores y los modelos de lenguaje tradicionales, la técnica de destilación de modelos, la ejecución de modelos de lenguaje de forma local y las complejidades del entrenamiento y la cuantización. 

Este episodio tiene como objetivo proporcionar a los oyentes una comprensión profunda y una perspectiva clara de los aspectos fundamentales y los avances recientes en el mundo de la IA y los modelos de lenguaje.

00:00 Introducción y Contexto del Debate

00:37 Modelos de Lenguaje y Censura

04:18 Funcionamiento Interno de los Modelos de Lenguaje

08:21 Entrenamiento y Parámetros de los Modelos

29:32 Fine-Tuning en Modelos de Lenguaje

40:19 Modelos Razonadores y su Evolución

44:50 Ejecución Local y Modelos Destilados

51:51 Conclusiones y Reflexiones Finales

...more
View all episodesView all episodes
Download on the App Store

Podcast DevExpertBy Podcast DevExpert


More shows like Podcast DevExpert

View all
Charla de Amigos by Martin Fabian Preza Depaulo/Guillermo Fiori

Charla de Amigos

2 Listeners