Informatique et sciences numériques (2023-2024) - Benoît Sagot

01 - Apprendre les langues aux machines : Représenter les unités textuelles


Listen Later

Collège de France

Benoît Sagot

Informatique et sciences numériques (2023-2024)

Année 2023-2024

01 - Apprendre les langues aux machines : Représenter les unités textuelles

Résumé

Les niveaux d'analyse linguistique. Phrases et mots. La loi de Zipf. Quelles représentations pour les mots (voire les phrases), quelles propriétés pour ces représentations ? Les mots (lexiques, lemmes), leurs représentations sous forme de structures de traits puis de vecteurs (embeddings). Illustration sur la tâche de détection d'entités nommées.

...more
View all episodesView all episodes
Download on the App Store

Informatique et sciences numériques (2023-2024) - Benoît SagotBy Collège de France