Le capacity planning ou l'art de consommer les ressources cloud au plus juste
Il n'est pas évident de donner une définition simple du capacity planning. Avec cette approche, une organisation évalue au mieux les ressources nécessaires à son activité. Elle s'assure de disposer des capacités adéquates pour atteindre ses objectifs tout en optimisant les coûts et, ce, sans compromettre ses performances. Cela fait quelques décennies que les acteurs de l'industrie, de la logistique, de la défense ou de la maintenance maitrisent cet art subtil du capacity planning. Si le référentiel de bonnes pratiques ITIL comprend une section complète consacrée au capacity management, l'informatique est à la traîne dans le domaine. En mode on-premise, une DSI a tendance à surdimensionner son infrastructure afin de pallier les éventuels pics d'activité et, tant pis, si les serveurs achetés ne sont utilisés au mieux qu'à 70% de leur capacité.
Avec le passage dans le cloud, l'intérêt de recourir au capacity planning se fait plus criant encore. En dépit de la souplesse et de l'élasticité offertes par les plateformes cloud, avec la fonctionnalité d'autoscaling ou le mode serverless, l'utilisateur doit toujours choisir la bonne configuration serveur en termes de processeur, de mémoire vive ou d'espace disque. Attention ensuite à ne pas oublier d'éteindre la machine virtuelle de tests à l'issue d'un projet car le compteur continue à tourner.
"A tort, des organisations se disent qu'elles n'ont plus à planifier leurs besoins dans le cloud puisqu'elles ne paient que ce qu'elles consomment", observe Christophe Roux, consultant chez Devoteam Cloud. "L'utilisation de services cloud à la demande, tarifés parfois à la seconde, constitue, au contraire, un véritable changement de paradigme." Autre idée reçue : une entreprise pense qu'elle paiera moins cher en passant par le cloud jusqu'à ce qu'elle voit les coûts exploser. "En fait, elle fait l'expérience de ce que coûte réellement l'IT", poursuit le consultant. "Louer une voiture n'a jamais coûté moins cher que de l'acheter."
La logique du "just in time"
Dans une logique "just in time", le capacity planning consiste pour la DSI à suivre très précisément son trafic de consommation puis à prédire quels seront ses besoins, à plus ou moins long terme, afin d'acquérir la bonne quantité de ressources au juste prix. Si la démarche FinOps consiste, dans une vision financière, à transformer un besoin métier en coûts, le capacity planning va un cran plus loin. Il s'agit d'ajuster au mieux la consommation de ressources en fonction d'une activité ou d'un projet tout en respectant un niveau de service attendu (SLA).
"Plus les données sont nombreuses et stables dans la durée et plus il est facile d'établir des facteurs de corrélation précis"
Ce qui suppose d'interroger les métiers. "Le capacity manager va multiplier les interviews en interne afin d'affiner la consommation au fonction du profil utilisateur", explique Taky Eddine Chorfa, expert cloud chez Sopra Steria. "Si un service RH consomme globalement 25 000 euros par mois en ressources cloud, il est possible d'optimiser plus finement. Un chargé de recrutement et un responsable formation n'utilisent pas la digital workplace de la même manière. Le capacity manager questionnera aussi les métiers sur leurs facteurs d'affluence. C'est-à-dire les événements ponctuels ou saisonniers qui correspondent à des pics de charge."
Observabilité et IA
Pour bâtir les scénarios d'affluence, l'historique de consommation livrera également de précieux enseignements. "Dématérialisées, les factures des providers, comprenant parfois des centaines lignes, peuvent être ingérées dans une base de données", note Taky Eddine Chorfa. "Plus les données sont nombreuses et stables dans la durée et plus il est facile d'établir des facteurs de corrélation précis."
Au regard du volume de données, l'analyse manuelle est difficilement possible et l'expert préconise de passer par des modèles statistiques de régression linéaire voire de deep learning. A noter que Netflix a publié, sur GitHub, les sources d'un outil de modélisation en accès libre. Toujours au rayon outillage, Christophe Roux conseille, de son côté, de se doter d'une plateforme d'observabilité. "Le capacity planning exige de rendre le système d'information très observable, des couches basses de l'infrastructure jusqu'aux métriques business." Les éditeurs spécialisés dans l'observabilité que sont Dynatrace, Splunk ou Datadog font également appel à l'IA pour analyser les journaux de logs.
Approche par les risques
Sur la base de ces données, la capacity manager pourra designer les services cloud au plus juste tout en adoptant une approche par les risques. "Quel est l'impact sur mon activité en cas d'indisponibilité ou de dégradation du service ?", interroge Taky Eddine Chorfa. Si l'on prend l'exemple d'une plateforme de streaming vidéo, jusqu'à quel point peut-elle tolérer des périodes de latence sans voir partir ses abonnés vers un service concurrent ? Dans une étude de cas proposée par AWS, Netflix détaille sa politique de capacity planning pour faire face à ce défi.
Dans le même temps, surprovisionner des ressources cloud pour se mettre à l'abri des aléas a un coût qui érode la rentabilité financière d'une organisation. "Il faut arriver à ajuster la consommation au plus près, d'où l'intérêt de se baser sur des données mesurables et anticipables", en conclut Taky Eddine Chorfa.
Le pilotage par la donnée permet également, selon lui, de simuler différentes hypothèses afin d'anticiper une nouvelle stratégie ou un changement dans l'organisation du travail. "Si une entreprise décide que le vendredi sera télétravaillé, quels seront les impacts sur sa consommation cloud ? Le capacity planning n'est pas nouveau mais les avancées en matière d'IA offrent la possibilité aujourd'hui de faire ce type de simulation", ajoute Taky Eddine Chorfa.
Enfin, cette visibilisé offerte via la data permet de réaliser de précieuses économies, non seulement en consommant des ressources cloud au plus juste mais aussi en contractualisant sur la durée auprès des providers. En contrepartie d'un engagement d'un à trois ans, AWS, Microsoft Azure ou Google Cloud concèdent d'importantes réductions avec les plans d'économies (saving plans) et les offres dites d'instances réservées. Ce n'est pas le moindre des bénéfices du capacity planning.