
Sign up to save your podcasts
Or


Un trombone.
Un grand merci au Centre pour la Sécurité de l'IA. Pour faire un tour sur leur discord, c'est par ici :
https://discord.gg/BRaqKU8hvf
Et pour leur site, par là :
https://www.securite-ia.fr/
Quelques sources en vrac :
Spreadsheet des "mauvaises instructions" : https://docs.google.com/spreadsheets/d/e/2PACX-1vRPiprOaC3HsCf5Tuum8bRfzYUiKLRqJmbOoC-32JorNdfyTiRRsR7Ea5eWtvsWzuxo8bjOxCG84dAg/pubhtml
"Sparks of Artificial General Intelligence: Early experiments with GPT-4" : https://arxiv.org/pdf/2303.12712
Papier sur l'AI Scientist : https://arxiv.org/pdf/2408.06292
"Optimal Policies Tend to Seek Power" : https://arxiv.org/pdf/1912.01683
"Open Problems and Fundamental Limitations of Reinforcement Learning from Human Feedback" : https://arxiv.org/pdf/2307.15217
"AI deception: A survey of examples, risks, and potential solutions" : https://www.ncbi.nlm.nih.gov/pmc/articles/PMC11117051/
Papier sur Diplomacy : https://noambrown.github.io/papers/22-Science-Diplomacy-TR.pdf
Mes réseaux :
Instagram : https://www.instagram.com/ego_yt/
Mail : [email protected]
_
Musiques :
00.00 : Particle Emission - Silver Maple
_
Le paragraphe qui suit ne concerne que Veridis Quo et m'évite une démonétisation. 🧙♂️ (Je n'arrive pas à savoir si c'est vrai ou s'ils veulent juste faire leur pub, mais dans le doute...)
🎵 Music licensed from Lickd. The biggest mainstream and stock music platform for content creators.
Veridis Quo by Daft Punk, https://lickd.lnk.to/gBaMBzID License ID: 7YBPwmMn6WE
If you want to use music from famous artists, try Lickd to get track credits and unlimited stock music: https://app.lickd.co/r/eeb941b561b24bbbaf91f2f8a39a3b96
Recherches, script, voix, récolte des médias et montage : moi-même. 😁
Correction : membres du Centre pour la Sécurité de l'IA ; un merci tout particulier à Amaury Lorin et Charbel-Raphaël Segerie
Direction artistique & motion design : Lucas perez, levilllageois sur Instagram, ou https://lucasperez.framer.website/
Illustrations : Marie Hermez, marie.hrmz sur Instagram
Animation des graphiques : Lou-Ann Guillon, lou.ann.guillon sur Instagram
Plans 3D : @_EkProd sur Twitter
Sound design des plans 3D : Samuel Badel, à retrouver sur samuelbadel.com
Correction de la miniature (oui c'est un vrai poste (non)) : Lua
Ça commence à faire du monde dis.
_
Prenez soin de vous.😘
By Un trombone.
Un grand merci au Centre pour la Sécurité de l'IA. Pour faire un tour sur leur discord, c'est par ici :
https://discord.gg/BRaqKU8hvf
Et pour leur site, par là :
https://www.securite-ia.fr/
Quelques sources en vrac :
Spreadsheet des "mauvaises instructions" : https://docs.google.com/spreadsheets/d/e/2PACX-1vRPiprOaC3HsCf5Tuum8bRfzYUiKLRqJmbOoC-32JorNdfyTiRRsR7Ea5eWtvsWzuxo8bjOxCG84dAg/pubhtml
"Sparks of Artificial General Intelligence: Early experiments with GPT-4" : https://arxiv.org/pdf/2303.12712
Papier sur l'AI Scientist : https://arxiv.org/pdf/2408.06292
"Optimal Policies Tend to Seek Power" : https://arxiv.org/pdf/1912.01683
"Open Problems and Fundamental Limitations of Reinforcement Learning from Human Feedback" : https://arxiv.org/pdf/2307.15217
"AI deception: A survey of examples, risks, and potential solutions" : https://www.ncbi.nlm.nih.gov/pmc/articles/PMC11117051/
Papier sur Diplomacy : https://noambrown.github.io/papers/22-Science-Diplomacy-TR.pdf
Mes réseaux :
Instagram : https://www.instagram.com/ego_yt/
Mail : [email protected]
_
Musiques :
00.00 : Particle Emission - Silver Maple
_
Le paragraphe qui suit ne concerne que Veridis Quo et m'évite une démonétisation. 🧙♂️ (Je n'arrive pas à savoir si c'est vrai ou s'ils veulent juste faire leur pub, mais dans le doute...)
🎵 Music licensed from Lickd. The biggest mainstream and stock music platform for content creators.
Veridis Quo by Daft Punk, https://lickd.lnk.to/gBaMBzID License ID: 7YBPwmMn6WE
If you want to use music from famous artists, try Lickd to get track credits and unlimited stock music: https://app.lickd.co/r/eeb941b561b24bbbaf91f2f8a39a3b96
Recherches, script, voix, récolte des médias et montage : moi-même. 😁
Correction : membres du Centre pour la Sécurité de l'IA ; un merci tout particulier à Amaury Lorin et Charbel-Raphaël Segerie
Direction artistique & motion design : Lucas perez, levilllageois sur Instagram, ou https://lucasperez.framer.website/
Illustrations : Marie Hermez, marie.hrmz sur Instagram
Animation des graphiques : Lou-Ann Guillon, lou.ann.guillon sur Instagram
Plans 3D : @_EkProd sur Twitter
Sound design des plans 3D : Samuel Badel, à retrouver sur samuelbadel.com
Correction de la miniature (oui c'est un vrai poste (non)) : Lua
Ça commence à faire du monde dis.
_
Prenez soin de vous.😘