Le 4 octobre en fin de journée, des centaines de millions (peut-être des milliards) d'utilisateurs ont relancé leurs applications WhatsApp, FaceBook, Instagram, pensant qu'un bug local perturbait leur fonctionnement, occasionnant au passage des pics de trafics anormaux susceptibles de perturber bien d'autres services.
En réalité, le 4 octobre, FaceBook, Whatapp et Instagram ont purement et simplement disparu d'Internet pendant plusieurs heures. On apprendra par la suite que cet incident majeur (pour ses utilisateurs) a été déclenché par une simple petite erreur de manipulation humaine dans une toute petite configuration d'un tout petit équipement de son infrastructure.
Cette minuscule erreur s’est alors propagée sur l'ensemble de l'infrastructure occasionnant une panne qui a littéralement surpris le monde entier.
Comment est-ce possible ? Qu'est-ce que BGP, le protocole incriminé ? À quoi sert-il et comment fonctionne-t-il ? Facebook a-t-il commis des erreurs de conception ? Cela peut il se (re)produire, chez Facebook ou chez d'autres ?
Nous relevons dans cet épisode le défi d'essayer de répondre à ces questions de façon pédagogique à l'aide de deux invités experts sur le sujet, et parti prenant dans la gestion d'une bonne partie du trafic d'Internet.
Les liens :
* [Blogpost de cloudflare](https://blog.cloudflare.com/october-2021-facebook-outage/) et en [Francais](https://blog.cloudflare.com/fr-fr/october-2021-facebook-outage-fr-fr/)
* [La bible de Andrew Tanenbaum](https://www.amazon.fr/R%C3%A9seaux-5e-%C3%A9dition-Andrew-Tanenbaum/dp/2744075213/ref=sr_1_1?qid=1636275838&refinements=p_27%3AAndrew+Tanenbaum&s=books&sr=1-1)
* [Juniper Day One](https://www.juniper.net/documentation/jnbooks/us/en/day-one-books)
* [facebook blog](https://engineering.fb.com)
* Acronymes :
* [AS(Autonomous Systems)](https://fr.wikipedia.org/wiki/Autonomous_System)
* [BGP (Border Gateway Protocol)](https://fr.wikipedia.org/wiki/Border_Gateway_Protocol)
* [DNS (Domain Name System)](https://fr.wikipedia.org/wiki/Domain_Name_System)
* [SPOF (Single point of Failure)](https://fr.wikipedia.org/wiki/Point_de_défaillance_unique)