
Sign up to save your podcasts
Or
Willem Meints, Chief AI Architect bij Aigency, bespreekt de technische innovaties achter DeepSeek in deze aflevering van AIToday Live. DeepSeek is een Chinees taalmodel dat de trainingskosten aanzienlijk heeft weten te verlagen.
Het model bestaat uit verschillende onderdelen, waaronder een chatbot-website, een onderliggend taalmodel en een speciaal reasoning model voor complexe taken. DeepSeek maakt gebruik van synthetische trainingsdata, efficiënter geheugengebruik en geautomatiseerde feedback om kosten te besparen.
De hosts bespreken de implicaties van deze ontwikkelingen voor de AI-industrie. De verlaging van trainingskosten kan leiden tot meer diversiteit in de ontwikkeling van taalmodellen.
Onderwerpen
Genoemde entiteiten: DeepSeek - GPT-4
Stuur ons een bericht
AigencySchrijf je in voor onze nieuwsbrief en ontvang exclusieve toegang tot nieuws, blik achter de schermen en meer!
Willem Meints, Chief AI Architect bij Aigency, bespreekt de technische innovaties achter DeepSeek in deze aflevering van AIToday Live. DeepSeek is een Chinees taalmodel dat de trainingskosten aanzienlijk heeft weten te verlagen.
Het model bestaat uit verschillende onderdelen, waaronder een chatbot-website, een onderliggend taalmodel en een speciaal reasoning model voor complexe taken. DeepSeek maakt gebruik van synthetische trainingsdata, efficiënter geheugengebruik en geautomatiseerde feedback om kosten te besparen.
De hosts bespreken de implicaties van deze ontwikkelingen voor de AI-industrie. De verlaging van trainingskosten kan leiden tot meer diversiteit in de ontwikkeling van taalmodellen.
Onderwerpen
Genoemde entiteiten: DeepSeek - GPT-4
Stuur ons een bericht
AigencySchrijf je in voor onze nieuwsbrief en ontvang exclusieve toegang tot nieuws, blik achter de schermen en meer!
22 Listeners
7 Listeners
18 Listeners
225 Listeners
12 Listeners
12 Listeners
5 Listeners
88 Listeners
70 Listeners
6 Listeners
6 Listeners
74 Listeners
4 Listeners
73 Listeners
1 Listeners