Nicolas et Maxime de Critéo partagent avec Emmanuel leur expérience de mise en place d'une organisation SRE (Site Reliability Engineering).
Enregistré le 12 novembre 2020
Téléchargement de l'épisode [LesCastCodeurs-Episode-243.mp3](http://traffic.libsyn.com/lescastcodeurs/LesCastCodeurs-Episode-243.mp3)
## Interview
### Ta vie, ton oeuvre
[Twotter Nicolas](https://twitter.com/nhelleringer)
[Twitter Maxime](https://twitter.com/brugidou)
[Criteo Labs](https://labs.criteo.com)
### SRE en 2 phrases
Site Reliability Engineering
C’est une façon de monter un salaire de sysadmin ?
### Pourquoi
Ops et dev, pourquoi “merger” ?
DevOps avec un sysadmin dans l'équipe vs SRE
Cela a du sens de le faire sur un “petit projet” ou uniquement si on gère 300k machines ?
### SRE au quotidien
Journée type
Dashboard
On code en quoi?
Pager (pendant les horaires travails vs dehors)
Les weekends
Taille SRE pour pour du 24/7
Combien de fois est-on appelé par nuit ?
Prod fallback
Le development
[Livre: le projet Unicorn](https://www.epflpress.org/produit/982/9782889153626/le-projet-unicorn)
### Concepts intéressants
50% eng
SLO SLI SLA
La difficulté de la valeur initiale
Perf passées vs calcul théorique
Error budget
Blast radius
Burn rate
### Pré conclusion
C'est la fin de la partie 1 de cette interview
## Nous contacter
[Faire un crowdcast ou une crowdquestion](https://lescastcodeurs.com/crowdcasting/)
Contactez-nous via twitter
sur le groupe Google
ou sur le site web
Flattr-ez nous (dons) sur
En savoir plus sur le sponsoring?