Les technologies de l’information et de la communication sont devenues, au cours des dernières années, un pôle majeur de consommation énergétique avec les conséquences environnementales associées. Dans le même temps, l’émergence du Cloud computing et des grandes plateformes en ligne a causé une augmentation en taille et en nombre des centres de données. Pour réduire leur impact écologique, alimenter ces centres avec des sources d’énergies renouvelables (EnR) apparaît comme une piste de solution.
Cependant, certaines EnR telles que les énergies solaires et éoliennes sont liées aux conditions météorologiques, et sont par conséquent intermittentes et incertaines. L’utilisation de batteries ou d’autres dispositifs de stockage est souvent envisagée pour compenser ces variabilités de production. De par leur coût important, économique comme écologique, ainsi que les pertes énergétiques engendrées, l’utilisation de ces dispositifs sans intégration supplémentaire est insuffisante. La consommation électrique d’un centre de données dépend principalement de l’utilisation des ressources de calcul et de communication, qui est déterminée par la charge de travail et les algorithmes d’ordonnancement utilisés. Pour utiliser les EnR efficacement tout en préservant la qualité de service du centre, une gestion coordonnée des ressources informatiques, des sources électriques et du stockage est nécessaire.
Il y a une grande diversité de centres de données, ayant différents types de matériel, de charge de travail et d’utilisation. De la même manière, suivant les EnR, les technologies de stockage et les objectifs en termes économiques ou environnementaux, chaque infrastructure électrique est modélisée et gérée différemment des autres. Des travaux existants proposent des méthodes de gestion d’EnR pour des couples bien spécifiques de modèles électriques et informatiques. Cependant, les multiples combinaisons de ces deux parties rendent difficile l’extrapolation de ces approches et de leurs résultats à des infrastructures différentes.
Cette thèse explore de nouvelles méthodes pour résoudre ce problème de coordination. Une première contribution reprend un problème d’ordonnancement de tâches en introduisant une abstraction des sources électriques. Un algorithme d’ordonnancement est proposé, prenant les préférences des sources en compte, mais conçu pour être indépendant de leur nature et des objectifs de l’infrastructure électrique.
Une seconde contribution étudie le problème de planification de l’énergie d’une manière totalement agnostique des infrastructures considérées. Les ressources informatiques et la gestion de la charge de travail sont encapsulées dans une boîte noire implémentant un ordonnancement sous contrainte de puissance. La même chose s’applique pour le système de gestion des EnR et du stockage, qui agit comme un algorithme d’optimisation d’engagement de sources pour répondre à une demande. Une optimisation coopérative et multiobjectif, basée sur un algorithme évolutionnaire, utilise ces deux boîtes noires afin de trouver les meilleurs compromis entre les objectifs électriques et informatiques.
Enfin, une troisième contribution vise les incertitudes de production des EnR pour une infrastructure plus spécifique. En utilisant une formulation en processus de décision markovien (MDP), la structure du problème de décision sous-jacent est étudiée. Pour plusieurs variantes du problème, des méthodes sont proposées pour trouver les politiques optimales ou des approximations de celles-ci avec une complexité raisonnable. |
In the recent years, the rise of information and communication technologies (ICT) made this area a major energy consumer with the associated ecological consequences. Meanwhile, the emergence of Cloud computing and massive Internet companies increased the importance and number of datacenters around the world. In order to mitigate economical and ecological cost, powering datacenters with renewable energy sources (RES) begin to appear as a sustainable solution.
Some of the commonly used RES such as solar and wind energies depends directly on weather conditions. Hence they are both intermittent and uncertain at some degree. Batteries or other energy storage devices (ESD) are often considered to deal with these issues, but result in additional energy losses and are too costly to be used alone, without more integration. The power consumption of a datacenter is closely tied to the computing resource usage, which in turn depends on its workload and on the scheduling algorithms used. To use RES as efficiently as possible while preserving the quality of service of a datacenter, a coordinated management of computing resources, electrical sources and storage is required.
There is a wide variety of datacenters, each with different hardware, kind of workload and purpose. Similarly, depending on the kind of RES used, ESD technologies and operating goals (cost or environmental impact) each electrical infrastructure is modeled and managed differently from the others. Some existing works successfully address this problem by considering specific couple of electrical and computing models. Because of this combined diversity, however, existing approaches and their findings can hardly be extrapolated to other infrastructures.
This thesis explores novel ways to deal with this coordination problem. A first contribution revisits batch task scheduling problem by introducing an abstraction of the power sources. A scheduling algorithm is proposed, taking preferences of electrical sources into account, but designed to be independent from the type of sources and from the goal of the electrical infrastructure (cost, environmental impact, mix of both).
A second contribution addresses the joint power planning coordination problem in a totally infrastructure-agnostic way. The datacenter computing resources and workload management is considered as a black-box implementing a scheduling under variable power constraint algorithm. The same goes for the electrical sources and storage management system, which acts as a source commitment optimization algorithm. A cooperative multi-objective power planning optimization, based on a multi-objective evolutionary algorithm (MOEA), uses the two black-boxes to find the best trade-offs between electrical and computing internal objectives.
Finally, a third contribution focuses on RES production uncertainties in a more specific infrastructure. Based on a Markov Decision Process (MDP) formulation, the structure of the underlying decision problem is studied. For several variants of the problem, tractable methods are proposed to find optimal policies or a bounded approximation. |