Eine KI besiegt die besten Menschen der Welt, obwohl sie die Regeln des Spiels gar nicht kennt. Klingt unmöglich? Genau das ist mit MuZero passiert.
MuZero gehört zu den erstaunlichsten Entwicklungen der modernen Künstlichen Intelligenz. Der von DeepMind entwickelte Algorithmus lernte Go, Schach, Shogi und zahlreiche Atari-Spiele auf Weltklasseniveau OHNE die Spielregeln zu kennen. Stattdessen erschafft das System sein eigenes internes Modell der Welt und trifft Entscheidungen auf Basis von Wahrscheinlichkeiten. Doch was bedeutet das für unser Verständnis von Intelligenz, Wissen und Bewusstsein?
Heute geht es nicht nur um KI-Forschung, AlphaGo, MuZero, DeepMind und Demis Hassabis. Es geht auch um große philosophische Fragen: Was ist Verstehen? Braucht Intelligenz überhaupt Bewusstsein? Und worin unterscheiden sich Menschen von Maschinen wirklich? Dabei begegnen wir Kant, Hume, Wittgenstein und dem berühmten Gedankenexperiment des Chinesischen Zimmers.
📅 Neue Ausgaben immer donnerstags, 19 Uhr.
👇👇👇
0:00 👉 Intro
4:52 👉 MuZERO: Wissen & Handeln auf Weltniveau ohne Regeln
8:03 👉 Das Weltmodell, das keiner kennt
12:28 👉 Das erste Netzwerk
16:26 👉 Das zweite und dritte Netzwerk
19:16 👉 Eine Modellwelt ohne Regeln
21:49 👉 Ein philosophischer Vergleich
23:29 👉 Der wunde Punkt – und ein tiefes philosophisches Problem
29:32 👉 Das unbelastbare System
33:47 👉 Noch ein philosophisches Problem
👇👇👇
Das Originalpaper zu MuZERO
Schrittwieser, J., Antonoglou, I., Hubert, T., Simonyan, K., Sifre, L., Schmitt, S., Guez, A., Lockhart, E., Hassabis, D., Graepel, T., Lillicrap, T. & Silver, D. (2020). Mastering Atari, Go, chess and shogi by planning with a learned model. Nature, 588(7839), 604–609. DOI: 10.1038/s41586-020-03051-4
AlphaGo (2016)
Silver, D., Huang, A., Maddison, C. J., Guez, A., Sifre, L., van den Driessche, G., Schrittwieser, J., Antonoglou, I., Panneershelvam, V., Lanctot, M., Dieleman, S., Grewe, D., Nham, J., Kalchbrenner, N., Sutskever, I., Lillicrap, T., Leach, M., Kavukcuoglu, K., Graepel, T. & Hassabis, D. (2016). Mastering the game of Go with deep neural networks and tree search. Nature, 529(7587), 484–489. DOI: 10.1038/nature16961
AlphaGo Zero (2017)
Silver, D., Schrittwieser, J., Simonyan, K. et al. (2017). Mastering the game of Go without human knowledge. Nature, 550, 354–359. DOI: 10.1038/nature24270
AlphaZero (2018)
Silver, D., Hubert, T., Schrittwieser, J., Antonoglou, I., Lai, M., Guez, A., Lanctot, M., Sifre, L., Kumaran, D., Graepel, T., Lillicrap, T., Simonyan, K. & Hassabis, D. (2018). A general reinforcement learning algorithm that masters chess, shogi, and Go through self-play. Science, 362(6419), 1140–1144. DOI: 10.1126/science.aar6404
ZU GO:
Tromp, J. & Farnebäck, G. (2007). Combinatorics of Go. In: van den Herik, H.J., Ciancarini, P. & Donkers, H.H.L.M. (Hrsg.), Computers and Games. CG 2006. Lecture Notes in Computer Science, Vol. 4630, S. 84–99. Springer, Berlin/Heidelberg. DOI: 10.1007/978-3-540-75538-8_8
Tromp, J. (2016). The Number of Legal Go Positions. In: Plaat, A., Kosters, W. & van den Herik, J. (Hrsg.), Computers and Games. CG 2016. Lecture Notes in Computer Science, Vol. 10068. Springer, Cham. DOI: 10.1007/978-3-319-50935-8_17
👇👇👇
Moderation, Recherche & Skript: Gert Scobel Zeichnungen: Claus Ast Eine Produktion der probono Fernsehproduktion GmbH: Anja Görner, Friedrich Küppersbusch, Jürgen Ohls, Kim Plettemeier, Maxie Römhild und René Fischell
Mit Unterstützung von: Alexander Hollmer, Annluise-Sophie Schröter, Arne Clasvogt und Pascal Hadré
Finanziert wird dieser Kanal vom gemeinnützigen AVE Institut für Achtsamkeit, Verbundenheit, Engagement (🔗 https://ave-institut.de/).
👇👇👇
Fragen und Anregungen gerne jederzeit per Mail an [email protected].
Und Tschüss.
#scobel