Bertrand Paquet, Principal Reliability Engineer chez Doctolib, partage le retour d'expĂ©rience de la double migration vers Graviton et Karpenter. Doctolib gĂšre 80 millions de patients avec un monolithe Ruby on Rails servant 20 000 requĂȘtes par seconde sur 1500 pods, dont 80% tournent sur des instances spot. La migration vers Graviton visait deux objectifs : rĂ©duire les coĂ»ts et diminuer le taux de reclaim des instances spot. L'Ă©quipe a adoptĂ© une approche pragmatique en utilisant d'abord la cross-compilation avec QEMU malgrĂ© les temps de build allongĂ©s, avant de migrer progressivement les workloads. La migration vers Karpenter a remplacĂ© les 14-15 node groups gĂ©rĂ©s par cluster autoscaler, simplifiant considĂ©rablement les mises Ă jour de cluster EKS et amĂ©liorant la gestion des prĂ©emptions spot grĂące au bin packing. Bertrand dĂ©taille les dĂ©fis rencontrĂ©s, notamment la nĂ©cessitĂ© d'ajouter des pod disruption budgets sur toutes les applications, et partage ses recommandations : ne pas hĂ©siter Ă migrer vers Graviton car c'est souvent un non-sujet technique, et adopter Karpenter dĂšs le dĂ©part pour tout nouveau cluster EKS.
Avec Betrand Paquet, Principal SRE at Doctolib
Podcast : Doctolib, the boring architecture (en français)