LMI MAG 4 Sept 2020 - Flipbook - Page 52
FOCUS
© AWS
Développement
AWS MET SON SERVICE
PRIME VIDEO À L’ÉPREUVE
DU CHAOS ENGINEERING
Provoquer des pannes dans ses systèmes informatiques en production pour tester
plus efficacement leur résistance, c’est le principe de l’ingénierie du chaos. Après Netflix,
Amazon Web Services montre comment il l’applique à son service de vidéo à la demande.
A
Maryse Gros
l’instar de Netflix, AWS éprouve
la résistance de son service de
streaming Prime Video en introduisant de façon contrôlée des
turbulences dans ses systèmes
de production. C’est le principe
de l’ingénierie du chaos. Cette
discipline consiste à mettre un
système à l’épreuve pour renforcer la confiance dans ses capacités à résister aux pannes
lorsqu’il sera en production. On la doit principalement à
Netflix qui l’a expérimentée avec son outil Chaos Monkey
il y a déjà plusieurs années. Celui-ci arrêtait de manière
pseudo-aléatoire un serveur de son service de vidéo
52 / septembre / octobre / novembre 2020
en ligne afin de fournir à ses équipes informatiques un
incident à résoudre dans les meilleures conditions d’intervention possibles, c’est-à-dire pendant les heures
ouvrées à un moment prévu à l’avance. L’objectif étant de
pouvoir en tirer enseignement pour faciliter la prise en
charge des incidents réels intervenant dans un contexte
plus délicat.
« L’ingénierie du chaos nécessite d’adopter des pratiques
pour identifier les interactions dans les systèmes distribués et les défaillances associées de façon proactive, ainsi
que la mise en œuvre et la validation de contre-mesures »,
rappelle AWS dans un billet daté du 18 août 2020 où l’opérateur de services cloud présente une approche d’injec-