Heute schauen wir uns die revolutionäre Transformer-Architektur und die sogenannte Self-Attention an, auf der die meisten modernen Sprachmodelle basieren. Wir lernen also wie GPT & Co. im Detail funktionieren und warum sie so gute Antworten generieren können.Das Paper dazu aus dem Jahr 2017 findet ihr hier: <a href="https://doi.org/10.48550/arXiv.1706.03762" target="_blank" rel="noopener noreferer">https://doi.org/10.48550/arXiv.1706.03762</a> Viel Spaß beim Zuhören! :)

Heute schauen wir uns die revolutionäre Transformer-Architektur und die sogenannte Self-Attention an, auf der die meisten modernen Sprachmodelle basieren. Wir lernen also wie GPT & Co. im Detail funktionieren und warum sie so gute Antworten generieren können. Das Paper dazu aus dem Jahr 2017 findet ihr hier: https://doi.org/10.48550/arXiv.1706.03762 Viel Spaß beim Zuhören! :)

Heute schauen wir uns die revolutionäre Transformer-Architektur und die sogenannte Self-Attention an, auf der die meisten modernen Sprachmodelle basieren. Wir lernen also wie GPT &amp; Co. im Detail funktionieren und warum sie so gute Antworten generieren können.Das Paper dazu aus dem Jahr 2017 findet ihr hier: <a href="https://doi.org/10.48550/arXiv.1706.03762" rel="noopener noreferrer">https://doi.org/10.48550/arXiv.1706.03762</a> Viel Spaß beim Zuhören! :)

Transformers - Wie funktionieren Sprachmodelle?

"KI - kurz und informativ" erklärt Künstliche Intelligenz verständlich, kompakt und ohne Fachchinesisch. In weniger als 5 Minuten erfahren Sie als Entscheider in Wirtschaft und Verwaltung, worum es eigentlich wirklich geht - ohne Hype von den Grundlagen, über Anwendungen im Unternehmen bis hin zu den neusten Entwicklungen.
Was ist ein Large Language Model (LLM)? Was sind neuronale Netze? Welche Datenschutzanforderungen muss ich beachten? EU AI Act? Wie bereite ich meine Daten auf? All das und vieles mehr sind Themen unserer Podcast-Reihe. Viel Spaß beim Zuhören!

Education

Courses

"KI - kurz und informativ" erklärt Künstliche Intelligenz verständlich, kompakt und ohne Fachchinesisch. In weniger als 5 Minuten erfahren Sie als Entscheider in Wirtschaft und Verwaltung, worum es eigentlich wirklich geht - ohne Hype von den Grundlagen, über Anwendungen im Unternehmen bis hin zu den neusten Entwicklungen. Was ist ein Large Language Model (LLM)? Was sind neuronale Netze? Welche Datenschutzanforderungen muss ich beachten? EU AI Act? Wie bereite ich meine Daten auf? All das und vieles mehr sind Themen unserer Podcast-Reihe. Viel Spaß beim Zuhören!

Share Transformers - Wie funktionieren Sprachmodelle?

Sign up to save your podcasts

Transformers - Wie funktionieren Sprachmodelle?

Transformers - Wie funktionieren Sprachmodelle?